两种基音周期检测方法

基音周期中两种算法

常用的基音周期检测方法-自相关函数法、倒谱法、平均幅度差函数法都属于非基于事件基音检测方法,都先将语音信号分为长度一定的语音帧,然后对每一帧语音求平均基音周期,它们的优点是比较简单,主要应用于只需要平均基音周期作为参数的语音编解码,语音识别等。

自相关函数具有很好的抗噪性,但易受半频、倍频错误影响。平均幅度差函数只需加法、减法和取绝对值等计算,算法简单;它们在无背景噪声情况下可以精确地提取的语音基音周期,但在语音环境较恶劣、信噪比较低时,检测的结果很差,难以让人满意。

2.1 基于短时自相关函数的方法

能量有限的语音信号{s (n ) }的短时自相关函数[10][11]定义为:

R n (τ) =N -1-τ

m =0∑[s (n +m ) w (m )][s (n +m +τ) w (m +τ)] (2.1)

其中,τ为移位距离,w (m ) 是偶对称的窗函数。

短时自相关函数有以下重要性质:

①如果{s (n ) }是周期信号,周期是P ,则R (τ) 也是周期信号,且周期相同,即R (τ) =R (P +τ) 。

②当τ=0时,自相关函数具有最大值;当τ=0, +P , +2P , +3P …处周期信号的自相关函数达到极大值。

③自相关函数是偶函数,即R (τ) =R (-τ) 。

短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。

在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。窗口长度N 的选择至少要大于基音周期的两倍,N 越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP ) 的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等;

N 越小,误差越大,但计算量较小。

图2-1 (a)原信号(b)自相关函数

Figure 2-1 (a) Original signal (b) AutoCorrection function

图2-2 (a)原信号(b)自相关函数

Figure 2-2 (a) Original signal (b) AutoCorrection function

基于自相关函数的算法是基音周期估计的常用方法,特别适用于噪声环境下

的基音提取。自相关函数在基音周期处表现为峰值,相邻两个峰值之间的间隔即为一个基音周期。但通常情况下,基波分量往往不是最强的分量,丰富的谐波成分使语音信号的波形变得非常复杂,给基音检测带来了困难,经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况。加之还有清浊混杂等情况,使基音检测成为一大难题。

如图2-1(a)是一帧语音信号,2-1(b)是这帧语音信号的自相关函数,可以看出自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,如图2-2(b)所示可以看出自相关函数检测出的基音周期是原始信号基音周期的一半,这是由于谐波峰值点(箭头所示) 的影响,这就是上述缺点中所说的倍频现象。

2.2 平均幅度差函数法

语音信号{s (n ) }的短时平均幅度差函数[12][13]定义为:

1N -1

F n (τ) =∑s (n +m ) w 1(m ) -s (n +m +τ) w 2(m +τ) (2.2) R n =0

其中,w (m ) 是窗函数,N 是一帧语音信号的长度,因为语音信号的浊音段具有周期性,我们假设基音周期为P ,则在浊音段,F n (τ) 在τ=+P , +2P , +3P …处将出现谷点,谷点间的距离即为基音周期。

实际应用中,窗函数w 1(m ) 和w 2(m ) 取矩形窗,这样可使短时平均幅度差函数F n (τ) 的定义更简单。短时平均幅度差函数可以写成:

1N -1

F n (τ) =∑s (n ) -s (n +τ) R n =0τ=0,1, …N -1

(2.3)

由于F n (τ) 只需加法、减法和取绝对值等计算,故算法简单,很易于硬件实现,从而使得短时平均幅度差函数法在基音检测中使用得相当普遍,著名的10阶线性预测声码器LPC-10声码器就采用AMDF 法来进行基音周期的提取。研究表明:当在静音环境下或当噪声较小时,AMDF 法可以取的较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的效果很差,难以让人满意。

如图2-3(a)是一帧语音信号,2-3(b)是这帧语音信号的平均幅度差函数,可

以看出平均幅度差函数在基音周期处表现为谷值,这些谷值之间的间隔的平均值就是所要求得基音周期。如图2-4(a)是在这帧语音信号中加入信噪比是2dB 噪声后的波形,由图2-4(b)可以看出它的平均幅度差函数中出现了很多谐波分量,基音峰值点基本淹没在这些谐波分量中,影响了基音周期的判断。

图2-3 (a) 原信号(b) 平均幅度差函数

Figure 2-3 (a) Original signal (b) Average magnitude difference function

图2-4 (a)加噪信号(b) 平均幅度差函数

Figure 2-4 (a) Signal added noise (b) Average magnitude difference function

基音周期中两种算法

常用的基音周期检测方法-自相关函数法、倒谱法、平均幅度差函数法都属于非基于事件基音检测方法,都先将语音信号分为长度一定的语音帧,然后对每一帧语音求平均基音周期,它们的优点是比较简单,主要应用于只需要平均基音周期作为参数的语音编解码,语音识别等。

自相关函数具有很好的抗噪性,但易受半频、倍频错误影响。平均幅度差函数只需加法、减法和取绝对值等计算,算法简单;它们在无背景噪声情况下可以精确地提取的语音基音周期,但在语音环境较恶劣、信噪比较低时,检测的结果很差,难以让人满意。

2.1 基于短时自相关函数的方法

能量有限的语音信号{s (n ) }的短时自相关函数[10][11]定义为:

R n (τ) =N -1-τ

m =0∑[s (n +m ) w (m )][s (n +m +τ) w (m +τ)] (2.1)

其中,τ为移位距离,w (m ) 是偶对称的窗函数。

短时自相关函数有以下重要性质:

①如果{s (n ) }是周期信号,周期是P ,则R (τ) 也是周期信号,且周期相同,即R (τ) =R (P +τ) 。

②当τ=0时,自相关函数具有最大值;当τ=0, +P , +2P , +3P …处周期信号的自相关函数达到极大值。

③自相关函数是偶函数,即R (τ) =R (-τ) 。

短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。

在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。窗口长度N 的选择至少要大于基音周期的两倍,N 越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP ) 的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等;

N 越小,误差越大,但计算量较小。

图2-1 (a)原信号(b)自相关函数

Figure 2-1 (a) Original signal (b) AutoCorrection function

图2-2 (a)原信号(b)自相关函数

Figure 2-2 (a) Original signal (b) AutoCorrection function

基于自相关函数的算法是基音周期估计的常用方法,特别适用于噪声环境下

的基音提取。自相关函数在基音周期处表现为峰值,相邻两个峰值之间的间隔即为一个基音周期。但通常情况下,基波分量往往不是最强的分量,丰富的谐波成分使语音信号的波形变得非常复杂,给基音检测带来了困难,经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况。加之还有清浊混杂等情况,使基音检测成为一大难题。

如图2-1(a)是一帧语音信号,2-1(b)是这帧语音信号的自相关函数,可以看出自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,如图2-2(b)所示可以看出自相关函数检测出的基音周期是原始信号基音周期的一半,这是由于谐波峰值点(箭头所示) 的影响,这就是上述缺点中所说的倍频现象。

2.2 平均幅度差函数法

语音信号{s (n ) }的短时平均幅度差函数[12][13]定义为:

1N -1

F n (τ) =∑s (n +m ) w 1(m ) -s (n +m +τ) w 2(m +τ) (2.2) R n =0

其中,w (m ) 是窗函数,N 是一帧语音信号的长度,因为语音信号的浊音段具有周期性,我们假设基音周期为P ,则在浊音段,F n (τ) 在τ=+P , +2P , +3P …处将出现谷点,谷点间的距离即为基音周期。

实际应用中,窗函数w 1(m ) 和w 2(m ) 取矩形窗,这样可使短时平均幅度差函数F n (τ) 的定义更简单。短时平均幅度差函数可以写成:

1N -1

F n (τ) =∑s (n ) -s (n +τ) R n =0τ=0,1, …N -1

(2.3)

由于F n (τ) 只需加法、减法和取绝对值等计算,故算法简单,很易于硬件实现,从而使得短时平均幅度差函数法在基音检测中使用得相当普遍,著名的10阶线性预测声码器LPC-10声码器就采用AMDF 法来进行基音周期的提取。研究表明:当在静音环境下或当噪声较小时,AMDF 法可以取的较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的效果很差,难以让人满意。

如图2-3(a)是一帧语音信号,2-3(b)是这帧语音信号的平均幅度差函数,可

以看出平均幅度差函数在基音周期处表现为谷值,这些谷值之间的间隔的平均值就是所要求得基音周期。如图2-4(a)是在这帧语音信号中加入信噪比是2dB 噪声后的波形,由图2-4(b)可以看出它的平均幅度差函数中出现了很多谐波分量,基音峰值点基本淹没在这些谐波分量中,影响了基音周期的判断。

图2-3 (a) 原信号(b) 平均幅度差函数

Figure 2-3 (a) Original signal (b) Average magnitude difference function

图2-4 (a)加噪信号(b) 平均幅度差函数

Figure 2-4 (a) Signal added noise (b) Average magnitude difference function


相关内容

  • 语音基频的提取算法
  • 第39卷 增刊 电 子 科 技 大 学 学 报 V ol.39 Suppl. 2010年4月 Journal of University of Electronic Science and Technology of China Apr. 2010 语音信号处理中基频提取算法综述 张 杰,龙子夜,张 ...

  • 八年级物理全册3.2声音的特性拓展素材
  • 声音的特性 参考资料 1.关于响度和振幅的实验演示. (1)如图1所示接好电路, 把动圈式扬声器 (8Ώ) (2)平放在桌面上, 纸盒口向上, 乒乓球放在纸盒中. (3)将滑动变阻器的滑动触片放在阻值最大处, 闭合开关. 在闭合的瞬间 , 可看到乒乓球有微小的跳动, 并听到扬声器发出一声轻轻的&qu ...

  • 隐马尔可夫模型HMM及其应用
  • 第30卷第4期湖南科技学院学报.b1.30No.42009年4月JoumaIofHunanUniVersityofScienceandEnginee-ngA"2009 隐马尔可夫模型(HMM)及苴府,.,-'用 王志堂1蔡淋波2 (1.湖南科技学院教育科学系.湖南永州425100:2.五邑 ...

  • 从有损到无损的音频编解码框架
  • igital Si g nal Processing 文章编号:1002-8684(2010)12-0060-05 数字信号处理 AVS 无损音频编解码技术 从有损到无损的音频编解码框架 杨新辉1,舒海燕2,曲天书3,张 涛4,窦维蓓 5 论文·· (1. 中科开元信息技术(北京)有限公司,北京10 ...

  • DSP课程设计论文
  • 第一章 绪论 语音信号处理课程的主要内容包括语音信号的分析方法及其应用.为了帮助学生理解与掌握 课程中的基本原理和基本分析方法,具有设计开发应用通信语音系统的基本能力,本文在介绍语音信号处理课程的内容和特点的基础上,结合MATLAB 软件和数字信号处理器DSP 硬件平台,提出了基于MATLAB 和D ...

  • 二胡演奏技法 揉弦
  • 学生在学揉弦方面容易出现的偏差主要有以下几点: ①滚揉时动作紧张.僵硬.各部位的配合不协调,主要表现在:手臂动作太大,动作过于主动:腕部不松弛,没有起到"轴"的作用.手指僵硬,第一关节不能自如地做屈伸运动.手掌里外扇动.用指力过多的抠弦,等等. ②揉弦时虎口移动,影响了揉弦的稳定 ...

  • 基于小波包分析的特征参数提取
  • 第20卷 第1期 2007年3月 宁波大学学报(理工版) JOURNAL OF NINGBO UNIVERSITY ( NSEE ) V ol.20 No.1 Mar. 2007 文章编号:1001-5132(2007)01-0051-04 基于小波包分析的特征参数提取 胡文吉,王让定 (宁波大学 ...

  • DIS通用实验三十八频率与音调的关系
  • 实验三十八 频率与音调的关系 实验目的 观察并研究声音音调与频率的关系. 实验原理 声音的音调取决于基音的频率. 实验器材 朗威DISLab .计算机.组合音叉等. 实验装置图 见图38-1. 图38-1 实验装置图 实验过程与数据分析 1.将声传感器接入数据采集器第一通道: 2.用不同音调的音叉, ...

  • 声音放置.咽音和横膈膜支持技巧是美声唱法的三大要素
  • 声音放置.咽音和横膈膜支持技巧是美声唱法的三大要素(转) 李慕寒 0位粉丝 1楼 声音放置.咽音和横膈膜支持技巧是美声唱法的三大要素 声音放置.咽音和横膈膜支持技巧是美声唱法的三大要素 G·兰培尔提是近代意大利声乐学派的权威教师.他认为,只要有清晰的发音技巧和横膈膜呼吸支持技巧,任何嗓音都是动人的. ...