信息熵理论

信息熵理论

在通信系统中,信息从发送到接收的传输过程是一个有干扰的信息复制过程。

对每一个具体的应用而言,传输的信息是确定的,有明确的应用目的。

对一个通信系统而言主,不同的用户要传送的具体的信息内容是不同的,则如何从这些繁杂的具体信息中提炼出它们的共同特征,并可进行量化估计是shannon信息论研究的基础。 所谓量化估计就是用提炼的共同特征估计与某些具体内容所对应的需要传输的信息量大小。 信息量定义的另一个重要特征是它能保证信息量值的大小与具体的信息内容无关。

1.定义信息熵:

设X是一个离散的随机变量,其定义空间为一个字符集E。

pxPXx,xE,表示相应的概率分布函数,则

HXpxlogpx称为离散随机变量的熵。

x

有时记HppxlogpxElogpX p

x

Ep表示以概率分布px对某随机变量或随机函数求概率平均。

2.定义联合熵:

设X﹑Y是丙个离散的随机变量,(X,Y)的联合概率分布函数为px,yPXx,Yy,则

HX,YPx,ylogpx,y

xy

称为离散随机变量X与Y的联合熵。

有时记为:

HX,Ypx,ylogpx,yEplogpX,Y

xy

3.定义条件熵:

如果X,Y~px,y,则条件熵HY/X定义为

HY/XpxHY/Xx

x



pxpy/xlogpy/x xypx,ylogpy/x

xy

ElogpY/X

条件熵等于零的条件为pXY1

事实上,对任意的x,y都有py/xlogpy/x0,从而得py/x0或py/x1,又因为X与Y是取值空间完全相同的随机变量,所以有pY/X1

定义相对熵:设px,qx是两个不同的离散概率分布函数,则

DpqpxpxlogqxE

xpXplogqX 

为概率分布函数px关于qx的相对熵。

相对熵的物理意义

相对熵反映了一个变量因取值概率的差异导致的信息量变化情况。若将px看作系统本身固有的概率分布,而qx看作人们对系统进行估计得到的经验概率分布,此时,相对熵反映了由于逼近误差引起的信息量的丢失量。

定义互信息:设X,Y是两个离散的随机变量,其联合概率分布函数为px,yPXx,Yy,相应的边沿分布密度函数为px和qx,则X与Y的互信息定义为

IX,Ypx,ypx,ylogpxpy

xy

Dpx,ypxqy

Epx,ylogpX,Y pXpY

互信息的物理意义

互信息反映了联合分布与边沿分布乘积的相对熵,也可看作利用边沿分布去逼近联合分布时所损失的信息量。

如果考虑一个通信系统,X表示发送端的输入变量,Y表示接收端的输出变量。虽然要信号的传输过程中,变量X受到一些不确定因素的干扰,而以变量Y的形式出现,显然,变量X和变量Y之间的一定的相关性,但它们的联合分布px,y与边沿分布的积pxpy是有差异的(因为后者代表了变量X与变量Y是统计独立的),这种差异可以利用信息量进行估计。IX,Y反映了它们之间的相对熵,这种相对熵也可看作是传输信道引起的联合信息量的变化量。

考虑一种特殊情况:当传输信道没有引入任何干扰,此时接收端收到的信号与发送端发送的信号完全相同,即Y=X,于是有

px,xy px,y 0,xy;

则 IX,Ypx,ypx,ylogpxpy

xy

pxlogpxHXHY

x

这表明发送端的信息完全传送到接收端而没有任何损失。

信息熵、联合熵、条件熵、相对熵和互信息的非负性

上述四个关系式表明信息熵、联合熵、条件熵、相对熵和互信息都是大于或等于零的量。

当信息熵和联合熵为零时,相应的变量以概率1取一确定的值,此时,它可以看作一常量。同时,它也表明:一个恒定的常量是不载有任何信息的。由此可以推断出一个变量所负载的信息量大小与它的变化程度有关;即一个变量所负载的信息量反映了此变量取值的不确定性。

信息熵理论

在通信系统中,信息从发送到接收的传输过程是一个有干扰的信息复制过程。

对每一个具体的应用而言,传输的信息是确定的,有明确的应用目的。

对一个通信系统而言主,不同的用户要传送的具体的信息内容是不同的,则如何从这些繁杂的具体信息中提炼出它们的共同特征,并可进行量化估计是shannon信息论研究的基础。 所谓量化估计就是用提炼的共同特征估计与某些具体内容所对应的需要传输的信息量大小。 信息量定义的另一个重要特征是它能保证信息量值的大小与具体的信息内容无关。

1.定义信息熵:

设X是一个离散的随机变量,其定义空间为一个字符集E。

pxPXx,xE,表示相应的概率分布函数,则

HXpxlogpx称为离散随机变量的熵。

x

有时记HppxlogpxElogpX p

x

Ep表示以概率分布px对某随机变量或随机函数求概率平均。

2.定义联合熵:

设X﹑Y是丙个离散的随机变量,(X,Y)的联合概率分布函数为px,yPXx,Yy,则

HX,YPx,ylogpx,y

xy

称为离散随机变量X与Y的联合熵。

有时记为:

HX,Ypx,ylogpx,yEplogpX,Y

xy

3.定义条件熵:

如果X,Y~px,y,则条件熵HY/X定义为

HY/XpxHY/Xx

x



pxpy/xlogpy/x xypx,ylogpy/x

xy

ElogpY/X

条件熵等于零的条件为pXY1

事实上,对任意的x,y都有py/xlogpy/x0,从而得py/x0或py/x1,又因为X与Y是取值空间完全相同的随机变量,所以有pY/X1

定义相对熵:设px,qx是两个不同的离散概率分布函数,则

DpqpxpxlogqxE

xpXplogqX 

为概率分布函数px关于qx的相对熵。

相对熵的物理意义

相对熵反映了一个变量因取值概率的差异导致的信息量变化情况。若将px看作系统本身固有的概率分布,而qx看作人们对系统进行估计得到的经验概率分布,此时,相对熵反映了由于逼近误差引起的信息量的丢失量。

定义互信息:设X,Y是两个离散的随机变量,其联合概率分布函数为px,yPXx,Yy,相应的边沿分布密度函数为px和qx,则X与Y的互信息定义为

IX,Ypx,ypx,ylogpxpy

xy

Dpx,ypxqy

Epx,ylogpX,Y pXpY

互信息的物理意义

互信息反映了联合分布与边沿分布乘积的相对熵,也可看作利用边沿分布去逼近联合分布时所损失的信息量。

如果考虑一个通信系统,X表示发送端的输入变量,Y表示接收端的输出变量。虽然要信号的传输过程中,变量X受到一些不确定因素的干扰,而以变量Y的形式出现,显然,变量X和变量Y之间的一定的相关性,但它们的联合分布px,y与边沿分布的积pxpy是有差异的(因为后者代表了变量X与变量Y是统计独立的),这种差异可以利用信息量进行估计。IX,Y反映了它们之间的相对熵,这种相对熵也可看作是传输信道引起的联合信息量的变化量。

考虑一种特殊情况:当传输信道没有引入任何干扰,此时接收端收到的信号与发送端发送的信号完全相同,即Y=X,于是有

px,xy px,y 0,xy;

则 IX,Ypx,ypx,ylogpxpy

xy

pxlogpxHXHY

x

这表明发送端的信息完全传送到接收端而没有任何损失。

信息熵、联合熵、条件熵、相对熵和互信息的非负性

上述四个关系式表明信息熵、联合熵、条件熵、相对熵和互信息都是大于或等于零的量。

当信息熵和联合熵为零时,相应的变量以概率1取一确定的值,此时,它可以看作一常量。同时,它也表明:一个恒定的常量是不载有任何信息的。由此可以推断出一个变量所负载的信息量大小与它的变化程度有关;即一个变量所负载的信息量反映了此变量取值的不确定性。


相关内容

  • 基于认知观的信息检索基础理论研究
  • 基于认知观的信息检索基础理论研究 杨秀丹/李皓 2012-11-12 14:26:21 来源:<图书情报工作>(京)2010年24期 [英文标题]On the Basic Theory of Information Retrieval Based on Cognitive Viewpoi ...

  • 信息用户满意度与信息素质教育内涵关联性审视
  • 内容提要:信息的人化,以及人化的信息已逐渐凸显为理论研究或实践的中心.文章从以信息用户满意度与信息素质教育为主体的以人为本信息研究领域的确立,信息用户满意度与信息素质教育是以人为本的信息研究体系中的两个子系统,笔者以信息用户满意度与信息素质教育的辩证统一关系为视角,提出了信息用户满意度与信息素质教育 ...

  • 信息经济学
  • 课程内容及其安排 ● 信息经济概论 ● 信息商品 ● 信息市场 ● 信息产业 ● 信息系统 ● 信息技术 ● 信息经济与信息化 ● 信息经济学与博弈论 课程内容及其安排 ● 总学时:48个 ● 考核方式:采用平时测试与期末考试相结合的方法,闭卷考试.平时成绩占30%,期末 考试占70%. ● 多媒体 ...

  • 电子信息工程考研方向解读
  • (随便看看就行) 这个是我在百度文库里面找到的一篇文章 看过之后 感觉很有收获 文章里详细介绍了各个方向研究的内容.前景和要求.并列出了各名牌高校的排名 希望对你有帮助~ 电子信息工程考研方向解读 电子信息工程考研的方向其实很多的,不过大家所知道甚少,笔者就搜集整理一些有关该专业的考研方向,希望对大 ...

  • 信息不对称理论研究文献综述
  • [摘 要]信息不对称理论是微观信息经济学研究的核心内容之一,本文通过搜集和整理相关文献,对信息不对称产生的原因.信息不对称的影响.如何规避信息不对称以及当前该理论存在争议的方面进行了归纳和总结. [关键词]信息不对称理论:逆向选择:市场效率 doi:10.3969/j.issn.1673 - 019 ...

  • 现代资本市场理论
  • (重定向自Modern Capital Market Theory) 现代资本市场理论(Modern Capital Market Theory) 目录 [隐藏] 1 现代资本市场理论的概述 2 现代资本市场理论的产生 3 现代资本市场理论的发展演变 4 对现代资本市场理论发展演变的评价 5 现代资 ...

  • [信息经济学]读书笔记-信息经济学理论
  • <信息经济学>读书笔记 --信息经济学概述及发展史 看到"信息经济学概述及发展史"这个主题时,我主要带着以下几个疑问和要点进行相关文献的查找和阅读:1.什么是信息经济学:2.信息经济学的产生及其发展过程;3.信息经济学的研究对象和内容,和传统经济学有哪些关联和区别: ...

  • 电子信息工程考研方向详细解读
  • 本文由975845600贡献 doc文档可能在WAP端浏览体验不佳.建议您优先选择TXT,或下载源文件到本机查看. 电子信息工程考研方向详细解读 电子信息工程考研方向详细解读 电子信息工程考研的方向其实很多的,不过大家所知道甚少,笔 者就搜集整理一些有关该专业的考研方向,希望对大家有所帮助. 考研方 ...

  • 当代西方语篇阅读信息加工过程理论的分歧与整合
  • 摘 要 当代西方语篇阅读研究过程中产生了多种理论与模式,它们试图对读者阅读过程的信息加工过程做出解释.文章从发展的角度介绍了建构主义理论.最低限度假设理论和记忆基础的文本加工观的历程.基本假设和实证研究,从中可以看出各种理论派别的分歧与整合的趋势. 关键词 语篇阅读,建构主义,最低限度假设,记忆基础 ...

  • 自考本科传播学概论资料
  • 内容来自:文档资源库 第一章 导论 第一节植根于人类社会生活的传播现象 1,人类社会的传播现象是怎样产生与发展的(由来 ? ,人类社会的传播现象是怎样产生与发展的 由来 由来) ? 究主要有:古代传播思想的整理与分析,近现代传播事业的演变等. 横向研究有:信息系统--研究与信息处理有关的理论和技术性 ...