主要介绍MP

:稀疏表示的本质就是稀疏正规化约束下的信号分解。提出一种改进的正交匹配追踪算法,使运算量较高的矩阵求逆

运算转变为轻量级的向量运算或向量与矩阵的运算,可以加快逆矩阵和大矩阵乘积的求解

主要介绍MP(Matching Pursuits)算法和OMP(Orthogonal Matching Pursuit)算法[1],这两个算法虽然在90年代初就提出来了,但作为经典的算法,国内文献(可能有我没有搜索到)都仅描述了算法步骤和简单的应用,并未对其进行详尽的分析,国外的文献还是分析的很透彻,所以我结合自己的理解,来分析一下写到博客里,算作笔记。

1. 信号的稀疏表示(sparse representation of signals)

给定一个过完备字典矩阵,其中它的每列表示一种原型信号的原子。给定一个信号y,它可以被表示成这些原子的稀疏线性组合。信号 y 可以被表达为 y = Dx ,或者

。 字典矩阵中所谓过完备性,指的是原

子的个数远远大于信号y的长度(其长度很显然是n),即n

2.MP算法(匹配追踪算法)

2.1 算法描述

作为对信号进行稀疏分解的方法之一,将信号在完备字典库上进行分解。

假定被表示的信号为y,其长度为n。假定H表示Hilbert空间,在这个空间H里,由一组向量构成字典矩阵D,其中每个向量可以称为原子(atom),其长度与被表

示信号 y 的长度n相同,而且这些向量已作为归一化处理,即|,也就是单位向量长度为1。MP算法的基本思想:从字典矩阵D(也称为过完备原子库中),选择一个与信号 y 最匹配的原子(也就是某列),构建一个稀疏逼近,并求出信号残差,然后继续选择与信号残差最匹配的原子,反复迭代,信号y可以由这些原子来线性和,再加上最后的残差值来表示。很显然,如果残差值在可以忽略的范围内,则信号y就是这些原子的线性组合。如果选择与信号y最匹配的原子?如何构建稀疏逼近并求残差?如何进行迭代?我们来详细介绍使用MP进行信号分解的步骤:[1] 计算信号 y 与字典矩阵中每列(原子)的内积,选择绝对值最大的一个原子,它就是与信号 y 在本次迭代运算中最匹配的。用专业术语来描述:令信号,从字典矩阵中选择一个最为匹配的原子,满足

,r0 表示一个字典矩阵的列索引。这样,

信号 y 就被分解为在最匹配原子的垂直投影分量和残值两部分,即:

。[2]对残值R1f进行步骤[1]同样的分解,那么第K步可以

得到:

, 其中 满足

。可见,经过K步分解后,信号

y 被分解为:,其中。

2.2 继续讨论

(1)为什么要假定在Hilbert空间中?Hilbert空间就是定义了完备的内积空。很显然,MP中的计算使用向量的内积运算,所以在在Hilbert空间中进行信号分解理所当然了。什么是完备的内积空间?篇幅有限就请自己搜索一下吧。

(2)为什么原子要事先被归一化处理了,即上面的描述。内积常用于计算一个矢量在一个方向上的投影长度,这时方向的矢量必须是单位矢量。MP中选择最匹配的原子是,是选择内积最大的一个,也就是信号(或是残值)在原子(单位的)垂直投影长度最长的一个,比如第一次分解过程中,投影长度就是

个向量,构成一个三角形,且

二维空间这两个矢量是垂直的)。 和。,三正交(不能说垂直,但是可以想象

(3)MP算法是收敛的,因为正交,由这两个可以得出比上一次的小,故而收敛。 2.3 MP算法的缺点 ,和,得出每一个残值如上所述,如果信号(残值)在已选择的原子进行垂直投影是非正交性的,这会使得每次迭代的结果并不少最优的而是次最优的,收敛需要很多次迭代。举个例子说明一下:在二维空间上,有一个信号 y 被 D=[x1, x2]来表达,MP算法迭代会发现总是在x1和x2上反复迭代,即,这个就是信号(残值)在已选择的原子进行垂直投影的非正交性导致的。再用严谨的方式描述[1]可能容易理解:在Hilbert空间H中,

,,定义,就是它是

;这里的Pvf表示 f在这些向量的张成中的一个,MP构造一种表达形式:

V上的一个正交投影操作,那么MP算法的第 k 次迭代的结果可以表示如下(前面描述时信号为y,这里变成f了,请注意):

如果

所以 是最优的k项近似值,当且仅当一般情况下是次优的。这是什么意思呢?。由于MP仅能保证,是k个项的线性表示,这个组合的值

正交,意作为近似值,只有在第k个残差和正交,才是最优的。如果第k个残值与

味这个残值与fk的任意一项都线性无关,那么第k个残值在后面的分解过程中,不可能出现fk中已经出现的项,这才是最优的。而一般情况下,不能满足这个条件,MP一般只能满足第k个残差和xk正交,这也就是前面为什么提到“信号(残值)在已选择的原子进行垂直投影是非正交性的”的原因。如果第k个残差和fk不正交,那么后面的迭代还会出现fk中已经出现的项,很显然fk就不是最优的,这也就是为什么说MP收敛就需要更多次迭代的原因。不是说MP一定得到不到最优解,而且其前面描述的特性导致一般得到不到最优解而是次优解。那么,有没有办法让第k个残差与

算法。

3.OMP算法 正交,方法是有的,这就是下面要谈到的OMP

3.1 算法描述 OMP算法的改进之处在于:在分解的每一步对所选择的全部原子进行正交化处理,这使得在精度要求相同的情况下,OMP算法的收敛速度更快。 那么在每一步中如何对所选择的全部原子进行正交化处理呢?在正式描述OMP算法前,先看一点基础思想。

先看一个 k 阶模型,表示信号 f 经过 k 步分解后的情况,似乎很眼熟,但要注意它与MP算法不同之处,它的残值与前面每个分量正交,这就是为什么这个算法多了一个正交的原因,MP中仅与最近选出的的那一项正交。

(1)

k + 1 阶模型如下:

(2)

应用 k + 1阶模型减去k 阶模型,得到如下:

(3)

我们知道,字典矩阵D的原子是非正交的,引入一个辅助模型,它是表示

项的依赖,描述如下: 对前k个

(4)

和前面描述类似,在span(x1, ...xk)之一上的正交投影操作,后面的项是残值。这个关系用数学符号描述:

请注意,这里的 a 和 b 的上标表示第 k 步时的取值。 将

(4)带入(3)中,有:

(5) 如果一下两个式子成立,(5)必然成立。

(6)

(7)

令,有

其中。

ak的值是由求法很简单,通过对(7)左右两边添加作内积消减得到:

后边的第二项因为它们正交,所以为0,所以可以得出ak的第一部分。对于

在(4)左右两边中与作内积,可以得到ak的第二部分。 ,

对于(4),可以求出,求的步骤请参见参考文件的计算细节部分。为什么这里不提,因为后面会介绍更简单的方法来计算。

3.2 收敛性证明

通过(7),由于与

正交,将两个残值移到右边后求二范的平方,并将ak的值代入可以得到:

可见每一次残差比上一次残差小,可见是收敛的。

3.3 算法步骤

整个OMP算法的步骤如下:

由于有了上面的来龙去脉,这个算法就相当好理解了。

到这里还不算完,后来OMP的迭代运算用另外一种方法可以计算得知,有位同学的论文[2]描述就非常好,我就直接引用进来:

对比中英文描述,本质都是一样,只是有细微的差别。这里顺便贴出网一哥们写的OMP算

法的代码,源出处不得而知,共享给大家。

再贴另外一个洋牛paper[3]中关于OMP

的描述,之所以引入,是因为它描述的非常严谨,但是也有点苦涩难懂,不过有了上面的基础,就容易多了。

它的描述中的Sweep步骤就是寻找与当前残差最大的内积时列在字典矩阵D中的索引,它的这个步骤描述说明为什么要选择内积最大的以及如何选择。见下图,说的非常清晰。

它的算法步骤Update Provisional Solution

中求很简单,就是在 b = Ax 已知 A和b求x, 在x的最小二范就是A的伪逆与b相乘,即:

看上去头疼,其实用matlab非常简单,看看上面的matlab的代码就明白了。

我们可以看得出来,算法流程清晰明了,还是很好理解的。这正是OMP算法的魅力,作为工具使用简单,背后却隐藏着很有趣的思想。 写这篇博客的目的,是因为搜索了一下,MP和OMP没有人很详细的介绍。文献[1]讲的很清楚的,大家有兴趣可以找来看看。不要被老板发现我居然在搜中文文献还写中文博客。

:稀疏表示的本质就是稀疏正规化约束下的信号分解。提出一种改进的正交匹配追踪算法,使运算量较高的矩阵求逆

运算转变为轻量级的向量运算或向量与矩阵的运算,可以加快逆矩阵和大矩阵乘积的求解

主要介绍MP(Matching Pursuits)算法和OMP(Orthogonal Matching Pursuit)算法[1],这两个算法虽然在90年代初就提出来了,但作为经典的算法,国内文献(可能有我没有搜索到)都仅描述了算法步骤和简单的应用,并未对其进行详尽的分析,国外的文献还是分析的很透彻,所以我结合自己的理解,来分析一下写到博客里,算作笔记。

1. 信号的稀疏表示(sparse representation of signals)

给定一个过完备字典矩阵,其中它的每列表示一种原型信号的原子。给定一个信号y,它可以被表示成这些原子的稀疏线性组合。信号 y 可以被表达为 y = Dx ,或者

。 字典矩阵中所谓过完备性,指的是原

子的个数远远大于信号y的长度(其长度很显然是n),即n

2.MP算法(匹配追踪算法)

2.1 算法描述

作为对信号进行稀疏分解的方法之一,将信号在完备字典库上进行分解。

假定被表示的信号为y,其长度为n。假定H表示Hilbert空间,在这个空间H里,由一组向量构成字典矩阵D,其中每个向量可以称为原子(atom),其长度与被表

示信号 y 的长度n相同,而且这些向量已作为归一化处理,即|,也就是单位向量长度为1。MP算法的基本思想:从字典矩阵D(也称为过完备原子库中),选择一个与信号 y 最匹配的原子(也就是某列),构建一个稀疏逼近,并求出信号残差,然后继续选择与信号残差最匹配的原子,反复迭代,信号y可以由这些原子来线性和,再加上最后的残差值来表示。很显然,如果残差值在可以忽略的范围内,则信号y就是这些原子的线性组合。如果选择与信号y最匹配的原子?如何构建稀疏逼近并求残差?如何进行迭代?我们来详细介绍使用MP进行信号分解的步骤:[1] 计算信号 y 与字典矩阵中每列(原子)的内积,选择绝对值最大的一个原子,它就是与信号 y 在本次迭代运算中最匹配的。用专业术语来描述:令信号,从字典矩阵中选择一个最为匹配的原子,满足

,r0 表示一个字典矩阵的列索引。这样,

信号 y 就被分解为在最匹配原子的垂直投影分量和残值两部分,即:

。[2]对残值R1f进行步骤[1]同样的分解,那么第K步可以

得到:

, 其中 满足

。可见,经过K步分解后,信号

y 被分解为:,其中。

2.2 继续讨论

(1)为什么要假定在Hilbert空间中?Hilbert空间就是定义了完备的内积空。很显然,MP中的计算使用向量的内积运算,所以在在Hilbert空间中进行信号分解理所当然了。什么是完备的内积空间?篇幅有限就请自己搜索一下吧。

(2)为什么原子要事先被归一化处理了,即上面的描述。内积常用于计算一个矢量在一个方向上的投影长度,这时方向的矢量必须是单位矢量。MP中选择最匹配的原子是,是选择内积最大的一个,也就是信号(或是残值)在原子(单位的)垂直投影长度最长的一个,比如第一次分解过程中,投影长度就是

个向量,构成一个三角形,且

二维空间这两个矢量是垂直的)。 和。,三正交(不能说垂直,但是可以想象

(3)MP算法是收敛的,因为正交,由这两个可以得出比上一次的小,故而收敛。 2.3 MP算法的缺点 ,和,得出每一个残值如上所述,如果信号(残值)在已选择的原子进行垂直投影是非正交性的,这会使得每次迭代的结果并不少最优的而是次最优的,收敛需要很多次迭代。举个例子说明一下:在二维空间上,有一个信号 y 被 D=[x1, x2]来表达,MP算法迭代会发现总是在x1和x2上反复迭代,即,这个就是信号(残值)在已选择的原子进行垂直投影的非正交性导致的。再用严谨的方式描述[1]可能容易理解:在Hilbert空间H中,

,,定义,就是它是

;这里的Pvf表示 f在这些向量的张成中的一个,MP构造一种表达形式:

V上的一个正交投影操作,那么MP算法的第 k 次迭代的结果可以表示如下(前面描述时信号为y,这里变成f了,请注意):

如果

所以 是最优的k项近似值,当且仅当一般情况下是次优的。这是什么意思呢?。由于MP仅能保证,是k个项的线性表示,这个组合的值

正交,意作为近似值,只有在第k个残差和正交,才是最优的。如果第k个残值与

味这个残值与fk的任意一项都线性无关,那么第k个残值在后面的分解过程中,不可能出现fk中已经出现的项,这才是最优的。而一般情况下,不能满足这个条件,MP一般只能满足第k个残差和xk正交,这也就是前面为什么提到“信号(残值)在已选择的原子进行垂直投影是非正交性的”的原因。如果第k个残差和fk不正交,那么后面的迭代还会出现fk中已经出现的项,很显然fk就不是最优的,这也就是为什么说MP收敛就需要更多次迭代的原因。不是说MP一定得到不到最优解,而且其前面描述的特性导致一般得到不到最优解而是次优解。那么,有没有办法让第k个残差与

算法。

3.OMP算法 正交,方法是有的,这就是下面要谈到的OMP

3.1 算法描述 OMP算法的改进之处在于:在分解的每一步对所选择的全部原子进行正交化处理,这使得在精度要求相同的情况下,OMP算法的收敛速度更快。 那么在每一步中如何对所选择的全部原子进行正交化处理呢?在正式描述OMP算法前,先看一点基础思想。

先看一个 k 阶模型,表示信号 f 经过 k 步分解后的情况,似乎很眼熟,但要注意它与MP算法不同之处,它的残值与前面每个分量正交,这就是为什么这个算法多了一个正交的原因,MP中仅与最近选出的的那一项正交。

(1)

k + 1 阶模型如下:

(2)

应用 k + 1阶模型减去k 阶模型,得到如下:

(3)

我们知道,字典矩阵D的原子是非正交的,引入一个辅助模型,它是表示

项的依赖,描述如下: 对前k个

(4)

和前面描述类似,在span(x1, ...xk)之一上的正交投影操作,后面的项是残值。这个关系用数学符号描述:

请注意,这里的 a 和 b 的上标表示第 k 步时的取值。 将

(4)带入(3)中,有:

(5) 如果一下两个式子成立,(5)必然成立。

(6)

(7)

令,有

其中。

ak的值是由求法很简单,通过对(7)左右两边添加作内积消减得到:

后边的第二项因为它们正交,所以为0,所以可以得出ak的第一部分。对于

在(4)左右两边中与作内积,可以得到ak的第二部分。 ,

对于(4),可以求出,求的步骤请参见参考文件的计算细节部分。为什么这里不提,因为后面会介绍更简单的方法来计算。

3.2 收敛性证明

通过(7),由于与

正交,将两个残值移到右边后求二范的平方,并将ak的值代入可以得到:

可见每一次残差比上一次残差小,可见是收敛的。

3.3 算法步骤

整个OMP算法的步骤如下:

由于有了上面的来龙去脉,这个算法就相当好理解了。

到这里还不算完,后来OMP的迭代运算用另外一种方法可以计算得知,有位同学的论文[2]描述就非常好,我就直接引用进来:

对比中英文描述,本质都是一样,只是有细微的差别。这里顺便贴出网一哥们写的OMP算

法的代码,源出处不得而知,共享给大家。

再贴另外一个洋牛paper[3]中关于OMP

的描述,之所以引入,是因为它描述的非常严谨,但是也有点苦涩难懂,不过有了上面的基础,就容易多了。

它的描述中的Sweep步骤就是寻找与当前残差最大的内积时列在字典矩阵D中的索引,它的这个步骤描述说明为什么要选择内积最大的以及如何选择。见下图,说的非常清晰。

它的算法步骤Update Provisional Solution

中求很简单,就是在 b = Ax 已知 A和b求x, 在x的最小二范就是A的伪逆与b相乘,即:

看上去头疼,其实用matlab非常简单,看看上面的matlab的代码就明白了。

我们可以看得出来,算法流程清晰明了,还是很好理解的。这正是OMP算法的魅力,作为工具使用简单,背后却隐藏着很有趣的思想。 写这篇博客的目的,是因为搜索了一下,MP和OMP没有人很详细的介绍。文献[1]讲的很清楚的,大家有兴趣可以找来看看。不要被老板发现我居然在搜中文文献还写中文博客。


相关内容

  • [制浆造纸原理与工程] 课程教学大纲
  • 第一部分 制浆原理与工程 绪论 1 学时 介绍制浆的基本概念和现代制浆的基本过程:制浆方法的分类和纸浆品种的名称:制浆技术的进展和发展趋势. 第一章 备料 4 学时 第一节 原料的贮存 一.介绍原料贮存的目的:维持正常连续生产的需要:改进原料质量的需要 二.介绍对原料场的基本要求:在防火与安全.排水 ...

  • 中国各民族介绍
  • 1.蒙古族介绍 :现有人口4806849 人.主要聚居在内蒙古自治区,其余分布在中国的东北.西北地区.蒙古族是一个历史悠久而又富于传奇色彩的民族.被誉为"草原骄子". 2.回族介绍 :主要聚居于宁夏回族自治区. 3.藏族介绍 :有人口4593330 人,主要分布在西藏自治区以及青 ...

  • 公务员会面礼仪
  • 会面,通常是指在较为正式的场合与别人相见.在日常工作中,基层公务员往往需要会见各式各样的客人.在会见他人时,尤其是当基层公务员以主人的身份在工作岗位上会见正式来访的客人时,既要对对方热情.友好,又要讲究基本的会面礼节.从某种意义上来说,假如不讲究基本的会面礼节,那么基层公务员对会见对象的热情友好往往 ...

  • 教销售员如何介绍产品
  • 教销售员如何介绍产品 2010-6-24 17:33:23 来源:全民业务员网 点击数:35 如何进行产品介绍是所有公司销售人员入门的必修课,也是最基础的技能,普遍采用的方式也大同小异,即公司派产品经理或者是销售经理进行产品的讲解,随着产品复杂程度不同培训的时间相对的长短不一,最后经过产品试讲或者是 ...

  • 公务员礼仪修养之办公礼仪规范7
  • 三.介绍的艺术 在人际交往中,特别是指人与人之间的初次交往中,介绍是一种最基本.最常规的沟通方式,同时也是人与人之间相互沟通的出发点. 在日常工作与生活里,基层公务员所应掌握的介绍主要有如下三种形式. (一)介绍自己 介绍自己,俗称自我介绍,它指的是由本人担任介绍人,自己把自己介绍给别人.基层公务员 ...

  • 接收预备党员基本程序
  • 接收预备党员基本程序 - 石屏组工信息网 - Powered by SupeSite石屏组工信息网 时政新闻 党建工作 干部工作 人才工作 远程教育 自身建设 领导讲话 组工信息 组工指南 政策法规 团建工作 他山之石 党代会常任制 新农村建设 科学发展观 大学生村官 创先争优 您的位置:石屏组工信 ...

  • 商务英语(专科)专业素质课程简介
  • 商务英语(专科)专业素质课程简介 1.基础商务英语:是英语综合课程,以教材为中心传授基础语言知识,通过听.读.写.译等方法,训练和培养学生的基本语言技能. 2.商务英语听说:主要培养学生英语听力技巧和英语口语能力,提高学生对各种情景中较高水平的英语听力材料的理解和逻辑判断能力,巩固提高英语语言实践能 ...

  • 工商管理本科各专业课程主要内容
  • 工商管理本科各专业课程主要内容 (供大家写论文找理论依据参考) 一.<组织行为学> 1.个体行为:人的行为特征:管理中人的因素及人本管理:个性理论的应用:气质.能力.性格的差异与应用:价值观.态度.工作态度与工作绩效:情绪的调适与情感的培养. 2.激励:激励机制及激励的作用:需要层次论. ...

  • 如何填写入党志愿书
  • 填写入党志愿书 93.什么是《中国共产党入党志愿书》? 94.印制《中国共产党入党志愿书》有何要求? 95.《中国共产党入党志愿书》与入党申请书有什么不同? 96.填写《中国共产党入党志愿书》有哪些基本要求? 97.请人代笔填写《中国共产党入党志愿书》应注意哪些问题? 98.有些栏目内容填写不下或无 ...

  • 大学理科专业介绍与就业方向
  • 大学专业介绍与就业方向(理科). 1. 数学与应用数学 专业介绍:本专业特点是理工结合,培养具有宽厚的数学基础,熟练的计算机应用和开发技能,较强的外语能力,并掌握一定的应用科学知识,能运用数学的理论和方法解决实际问题的高级科技人才. 就业去向:毕业生适合到科研.工程.经济.金融.管理等部门和高等院校 ...