费诺编码论文

多媒体技术之费诺编码

通信

多媒体技术,即是计算机交互式综合处理多媒体信息----文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。简言之,多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。多媒体在我国也有自己的定义,一般认为多媒体技术指的就是能对多种载体(媒介) 上的信息和多种存储体(媒介) 上的信息进行处理的技术。近几年来,计算机多媒体技术快速发展并走向成熟,在微机上就可以实现许多传统模拟的数字化。使得视频、音频、图像、动画和图形文字一起在计算机中进行处理,因此,计算机所处理和表达的信息量急剧增加,从而为多媒体计算机在计算机辅助课堂教学中的应用提供了可能。

早期的数据压缩来自于人们对概率的了解。当对文字信息进行编码时,如果为出现概率较高的字母赋予较短的编码,为出现概率较低的字母赋予较长的编码,平均编码长度就能缩短不少。印象中的著名的Morse 电码就是一个范例。信息论之父C.E.Shannon 曾指出,任何信息都存在冗余,冗余大小与信息中每个符号的出现概率(不确定性)有关。他所提出的无失真信源编码定理奠定了数据压缩的理论基础。数据压缩的目的就是要消除信息中的冗余,而信息熵及相关的定理恰恰用数学手段精确地描述了信息冗余的程度。信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。从DVD 到个人电脑,从卫星通信到文件,在我们今天的生活中,信息几乎在每个领域都扮演着重要角色。工程师克劳德·香农于1948年奠定了信息论的基础,他指出了通信的极限。基于这一理论产生了数据压缩技术、纠错技术等各种应用技术,这些技术提高了数据传输和存储的效率。信息论将信息的传递作为一种统计现象来考虑,给出了估算通信信道容量的方法。信息传输和信息压缩是信息论研究中的两大领域。这两个方面又由信息传输定理、信源-信道隔离定理相互联系。当然,信息论的重大应用远不止于此。DNA 是一种信息存储物质,正是信息论帮助人们解开了生物基因组密码之谜。简单地说信息论包含了生命、宇宙乃至一切。

信息论对现代社会的影响是多方面的。首先, 在理论研究方面, 信息论所处的地位已远远超出了香农当年所界定的“通信的数学理论”的范畴, 得到了不断的扩充和发展, 出现了语义信息、语法信息与语用信息等研究与信息的意义有关的学科, 以及面向智能研究的全信息理论 。如今, 信息已成为与物质、能量并列的宇宙中的三个基本要素, 世间万物的发展变化可归结为物质、能量和信息的传递和转化过程。另一方面, 在科学和技术高度发展的今天, 信息的概念也被渗透到许多不同的学科和领域, 深入到了社会生活的各个方面, 成为可与相对论和量子力学并驾齐驱的新一代边缘交叉学科的重要组成部分。特别是以信息论、控制论和系统论为代表的“老三论”以及以普里高津(I.Prigogine)的耗散结构理论, 哈肯(H.Haken)的协同学和托姆(R.Thom)的突变论或艾根(M.Eigen)的超循环理论为代表的“新三论”的出现, 标志着一代新的边缘交叉学科的兴起。它们的形成和发展对现代科学的研究具有重要的方法论上的指导意义。

费诺编码是一种信源编码. 信源编码分为无失真信源编码和限失真信源编码。一般称无失真信源编码为第一机械定理;限失真信源编码定理称为第三极限定理。

由于信源符号之间存在分布不均匀和相关性,使得信源存在冗余度,信源编码的主要任务就是减少冗余,提高编码效率。具体说,就是针对信源输出符号序列的统计特性,寻找一定的方法把信源输出符号序列变换为最短码字序列的方法。信源编码的基本途径有两个:使编码中各个符号出现的概率尽可能地相等,即概率均匀化。信源编码的基础是信息论中的两个编码定理:无失真编码定理和限失真编码定理。其中无失真编码定理是可逆编码的基础。可逆是指当信源符号转换成代码后,可从代码无失真地恢复信源符号。当已知信源符号的概率特性时,可计算它的符号熵,这表示每个信源符号所载有的信息量。编码定理不但证明了必定存在一种编码方法,可使代码的平均长度可任意接近但不低于符号熵,而且还阐明达到这目标的途径,就是使概率与码长匹配。无失真编码或可逆编码只适用于离散信源。对于连续信源,编成代码后就无法无失真地恢复原来的连续值,因为后者的取值可有无限多个。此时只能根据率失真编码定理在失真受限制的情况下进行限失真编码。信源编码定理出现后,编码方法就趋于合理化。

凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合称为最佳变长码。能获得最佳码的编码方法主要有:香农码(Shannon) 、费诺(Fano)、哈夫曼(Huffman)编码等。费诺编码算法

1.将信源消息符号按其出现的概率大小依次排列:P1>=P2>=„>=Pn。

2.依次排列的信源符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”。

3.使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号“0”和“1”。

4.如此重复,直至每个组只剩下一个信源符号为止。

5.信源符号所对应的码字即为费诺码。

费诺编码,它编码后的费诺码要比香农码的平均码长小,消息传输速率大,编码效率高,但它属于概率匹配编码它不是最佳的编码方法[。

费诺编码方法属于概率匹配编码,具有如下特点:

1、概率大,则分解次数小;概率小则分解次数多。这符合最佳码原则。

2、码字集合是唯一的。

3、分解完了,码字出来了,码长也有了, 即先有码字后有码长。

因此,费诺编码方法又称为子集分解法

费诺编码也是一种常见的信源编码方法。信源符号以概率递减的次序排列进来, 将排列好的信源符号划分为两大组, 使第组的概率和近于相同, 并各赋于一个二元码符号”0”和”1”. 然后, 将每一大组的信源符号再分成两组, 使同一组的两个小组的概率和近于相同, 并又分别赋予一个二元码符号. 依次下去, 直至每一个小组只剩下一个信源符号为止. 这样, 信源符号所对应的码符号序列则为编得的码字。本文将通过采用递归的思想进行费诺编码,求得了每个字符的二进制码字。并且对编码后的平均码长,以及编码的传输效率进行了求解。符合费诺编码的要求,得到了预期的编码结果。

多媒体技术之费诺编码

通信

多媒体技术,即是计算机交互式综合处理多媒体信息----文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。简言之,多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。多媒体在我国也有自己的定义,一般认为多媒体技术指的就是能对多种载体(媒介) 上的信息和多种存储体(媒介) 上的信息进行处理的技术。近几年来,计算机多媒体技术快速发展并走向成熟,在微机上就可以实现许多传统模拟的数字化。使得视频、音频、图像、动画和图形文字一起在计算机中进行处理,因此,计算机所处理和表达的信息量急剧增加,从而为多媒体计算机在计算机辅助课堂教学中的应用提供了可能。

早期的数据压缩来自于人们对概率的了解。当对文字信息进行编码时,如果为出现概率较高的字母赋予较短的编码,为出现概率较低的字母赋予较长的编码,平均编码长度就能缩短不少。印象中的著名的Morse 电码就是一个范例。信息论之父C.E.Shannon 曾指出,任何信息都存在冗余,冗余大小与信息中每个符号的出现概率(不确定性)有关。他所提出的无失真信源编码定理奠定了数据压缩的理论基础。数据压缩的目的就是要消除信息中的冗余,而信息熵及相关的定理恰恰用数学手段精确地描述了信息冗余的程度。信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。从DVD 到个人电脑,从卫星通信到文件,在我们今天的生活中,信息几乎在每个领域都扮演着重要角色。工程师克劳德·香农于1948年奠定了信息论的基础,他指出了通信的极限。基于这一理论产生了数据压缩技术、纠错技术等各种应用技术,这些技术提高了数据传输和存储的效率。信息论将信息的传递作为一种统计现象来考虑,给出了估算通信信道容量的方法。信息传输和信息压缩是信息论研究中的两大领域。这两个方面又由信息传输定理、信源-信道隔离定理相互联系。当然,信息论的重大应用远不止于此。DNA 是一种信息存储物质,正是信息论帮助人们解开了生物基因组密码之谜。简单地说信息论包含了生命、宇宙乃至一切。

信息论对现代社会的影响是多方面的。首先, 在理论研究方面, 信息论所处的地位已远远超出了香农当年所界定的“通信的数学理论”的范畴, 得到了不断的扩充和发展, 出现了语义信息、语法信息与语用信息等研究与信息的意义有关的学科, 以及面向智能研究的全信息理论 。如今, 信息已成为与物质、能量并列的宇宙中的三个基本要素, 世间万物的发展变化可归结为物质、能量和信息的传递和转化过程。另一方面, 在科学和技术高度发展的今天, 信息的概念也被渗透到许多不同的学科和领域, 深入到了社会生活的各个方面, 成为可与相对论和量子力学并驾齐驱的新一代边缘交叉学科的重要组成部分。特别是以信息论、控制论和系统论为代表的“老三论”以及以普里高津(I.Prigogine)的耗散结构理论, 哈肯(H.Haken)的协同学和托姆(R.Thom)的突变论或艾根(M.Eigen)的超循环理论为代表的“新三论”的出现, 标志着一代新的边缘交叉学科的兴起。它们的形成和发展对现代科学的研究具有重要的方法论上的指导意义。

费诺编码是一种信源编码. 信源编码分为无失真信源编码和限失真信源编码。一般称无失真信源编码为第一机械定理;限失真信源编码定理称为第三极限定理。

由于信源符号之间存在分布不均匀和相关性,使得信源存在冗余度,信源编码的主要任务就是减少冗余,提高编码效率。具体说,就是针对信源输出符号序列的统计特性,寻找一定的方法把信源输出符号序列变换为最短码字序列的方法。信源编码的基本途径有两个:使编码中各个符号出现的概率尽可能地相等,即概率均匀化。信源编码的基础是信息论中的两个编码定理:无失真编码定理和限失真编码定理。其中无失真编码定理是可逆编码的基础。可逆是指当信源符号转换成代码后,可从代码无失真地恢复信源符号。当已知信源符号的概率特性时,可计算它的符号熵,这表示每个信源符号所载有的信息量。编码定理不但证明了必定存在一种编码方法,可使代码的平均长度可任意接近但不低于符号熵,而且还阐明达到这目标的途径,就是使概率与码长匹配。无失真编码或可逆编码只适用于离散信源。对于连续信源,编成代码后就无法无失真地恢复原来的连续值,因为后者的取值可有无限多个。此时只能根据率失真编码定理在失真受限制的情况下进行限失真编码。信源编码定理出现后,编码方法就趋于合理化。

凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合称为最佳变长码。能获得最佳码的编码方法主要有:香农码(Shannon) 、费诺(Fano)、哈夫曼(Huffman)编码等。费诺编码算法

1.将信源消息符号按其出现的概率大小依次排列:P1>=P2>=„>=Pn。

2.依次排列的信源符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”。

3.使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号“0”和“1”。

4.如此重复,直至每个组只剩下一个信源符号为止。

5.信源符号所对应的码字即为费诺码。

费诺编码,它编码后的费诺码要比香农码的平均码长小,消息传输速率大,编码效率高,但它属于概率匹配编码它不是最佳的编码方法[。

费诺编码方法属于概率匹配编码,具有如下特点:

1、概率大,则分解次数小;概率小则分解次数多。这符合最佳码原则。

2、码字集合是唯一的。

3、分解完了,码字出来了,码长也有了, 即先有码字后有码长。

因此,费诺编码方法又称为子集分解法

费诺编码也是一种常见的信源编码方法。信源符号以概率递减的次序排列进来, 将排列好的信源符号划分为两大组, 使第组的概率和近于相同, 并各赋于一个二元码符号”0”和”1”. 然后, 将每一大组的信源符号再分成两组, 使同一组的两个小组的概率和近于相同, 并又分别赋予一个二元码符号. 依次下去, 直至每一个小组只剩下一个信源符号为止. 这样, 信源符号所对应的码符号序列则为编得的码字。本文将通过采用递归的思想进行费诺编码,求得了每个字符的二进制码字。并且对编码后的平均码长,以及编码的传输效率进行了求解。符合费诺编码的要求,得到了预期的编码结果。


相关内容

  • 博士 硕士论文题目: 可伸缩视频编码研究
  • 博士/硕士论文题目: 可伸缩视频编码研究 答辩时间: 2008年5月13日 答辩委员会主席: 王鼎兴 答辩委员会成员:李锦涛.查红彬.戴琼海.卢汉清.尹宝才.林守 勋 毕业时间: 研究方向: 视频编码 导师: 赵德斌.高文 毕业去向: 曾获奖项: 中科院计算所所长特别奖.计算所优秀论文奖 毕业论文的 ...

  • 有色金属加工工程项目分类标准与实施
  • 第38卷第6期2009年12月 有色金属加工 NONFERROUSMETALSPROCESSING VoL38No.6 December2009 有色金属加工工程项目分类标准与实施 马书志 (洛阳有色金属加工设计研究院,河南洛阳471039) 摘要:本文论述了有色金属加工工程项目分类的必要性.提出了 ...

  • 毕业设计工作周志
  • 毕业设计工作周志 学生姓名: 指导教师: 所在学院:信息技术学院 专 业:计算机科学与技术 2010 年 5 月 周 志 2009年12月28日--2010年1月3日 第一周 本周是毕业设计的第一周,接到老师下达的毕业设计课题之后,我马上进入了设计任务的第一阶段,即问题定义阶段.经过两天的问题定义, ...

  • 论文投稿刊物
  • 1. 机电工程技术 (双月刊) 本刊是广东省机械工程学会会刊.广东省优良科技期刊.中国学术期刊综合评价源刊.中国期刊网和中国学术期刊(光盘版)全文收录期刊.<中国机械工程文摘>摘录源刊.由广东省机械工程学会.广东省机械研究年.广东省机械技术情报站主办,重点报导沿海地域在改造开放和发展市场 ...

  • 三相异步电动机的闭环恒速控制系统_毕业设计论文
  • 毕 业 设 计 论 文 三相异步电动机的闭环恒速控制 系统 专 业 名 [摘要]系统的输出量返回到输入端并对控制过程产生影响的控制系统称为闭环控制系统.本文介绍了闭环控制系统的组成.PLC 系统控制程序.系统的调试等. 基于反馈原理建立的自动控制系统.所谓反馈原理,就是根据系统输出变化的信息来进行控 ...

  • 信息论与编码_论文
  • 信息论与编码之数据压缩 摘要: 在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元(或者其它信息相关的单位)表示信息的过程.例如,如果我们将"compression"编码为"comp"那么这篇文章可以用较少的数据位表示.一种 ...

  • 同步带传动精度测试系统的研究
  • 第33卷第5期 文章编号:1004-2539(2009)05-0015-02 同步带传动精度测试系统的研究 15 同步带传动精度测试系统的研究 (西华大学机械工程与自动化学院,四川成都610039) 康博陈守强郝良果 摘要介绍了同步带传动精度试验的一种新方法,利用两个编码器分别获得主.从同步带轮的运 ...

  • 工程量清单计价模式论文
  • 工程量清单计价模式论文 摘要:工程量清单计价体现的是公平.公正.公开的原则,体现的是市场竞争机制,它是逐步与国际接轨的.符合我国市场经济的造价体系. 2003年7月1日,建设部批准<建设工程工程量清单计价规范>(GB50500-2003)实施,这种新的计价方式与传统的定额计价有很大的区别 ...

  • 博士研究生培养方案模板
  • 安徽师范大学 攻读博士学位研究生培养方案 专业名称(代码) 所属一级学科名称(代码) 授予博士学位门类(代码) 071011 生物学(0710) 理学 安徽师范大学研究生学院制表 填表日期:2012年 7 月 1 日 一.培养目标 培养适应我国社会发展需要的,德智体全面发展的高层次专门人才.要求学位 ...