音频编码过程

1.音频信号数字化

信号的数字化就是将连续的模拟信号转换成离散的数字信号,一般需要完成采样、量化和编码三个步骤,如图1所示。采 样是指用每隔一定时间间隔的信号样本值序列来代替原来在时间上连续的信号。量化是用有限个幅度近似表示原来在时间上 连续变化的幅度值,把模拟信号的连续幅度变为有限数量、有一定时间间隔的离散值。编码则是按照一定的规律,把量化后 的离散值用二进制数码表示。上述数字化的过程又称为脉冲编码调制(Pulse Code Modulation),通常由A/D转换器来实现 。

图1 音频信号数字化

数字音频信号经过处理、记录或传输后,当需要重现声音时,还必须还原为连续变化的模拟信号。将数字信号转换成模拟 信号为D/A变换。

数字音频的质量取决于采样频率和量化位数。采样频率越高,量化位数越多,数字化后的音频质量越高。

2.音频采样

采样就是从一个时间上连续变化的模拟信号取出若干个有代表性的样本值,来代表这个连续变化的模拟信号。一个在时间 和幅值上都连续的模拟音频信号的函数表示为x(t),采样的过程就是在时间上将函数x(t)离散化的过程。一般的采样是按均 匀的时间间隔进行的。设这一时间间隔为T,则取样后的信号为x(nT),n为自然数。

根据奈奎斯特采样定理:要从采样值序列完全恢复原始的波形,采样频率必须大于或等于原始信号最高频率的2倍。设连 续信号x(t)的频谱为x(f),以采样间隔时间T抽样得到离散信号X(nT),如果满足|f|≤fc时,其中fc是截止频率,即T≤ 1/2f,时,可以由x(nT)完全确定连续信号x(f):

当采样频率为1/2T时。即fN=1/2T时,称fN为佘奎斯特采样频率.

3.音频量化

采样把模拟信号变成了时间上离散的样值序列,但每个样值的幅度仍然是一个连续的模拟量,因此还必须对其进行离散化 处理,将其转换为有限个离散值,才能最终与数码来表示其幅值。量化过程是将采样值在幅度上再进行离散化处理的过程。 所有的采样值可能出现的范围被划分成有限多个量化阶的集合,把凡是落入某个量化阶内的采样值都赋予相同的值,即量化 值。通常这个量化值用二进制来表示,用N位二进制码字可以表示2N个不同的量化电平。存储数字音频信号的比特率为:

I=N.fs

其中的fs是采样率,N是每个采样值的比特数。

表示采样值的二进制的位数为量化位数,它反映出各采样值的精度,如3位能表示采样值的8个等级,8位能反映256个等级 ,其精度为音频信号最大振幅的1/256。量化位数越多,量化值越接近于采样值,其精度越高,但要求的信息存储量就越大 。

根据公式(30-3)可知,要减小比特率I,在fs已经确定的情况下,只能去减少N的值。N的值降低会导致量化的精度降低 ,N的值增加又会导致信息存储量的增加。因此在编码时就需要合理地选择N的值。

均匀量化就是采用相等的量化间隔进行采样,也称为线性量化。用均匀量化来量化输入信号时,无论对大的输入信号还是 小的输入信号都一律采用相同的量化间隔。因此,要想既适应幅度大的输入信号,同时又要满足精度高的要求,就需要增加 采样样本的位数。

非均匀量化的基本思想是对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这 样就可以在满足精度要求的情况下使用较少的位数来表示。其中采样输入信号幅度和量化输出数据之间一般定义了两种对应 关系,一种称为u律压缩算法,另一种称为A律压缩算法。

采用不同的量化方法,量化后的数据量也就不同。因此说量化也是一种压缩数据的方法。

4.音频编码

采样、量化后的信号还不是数字信号,需要把它转换成数字脉冲,这一过程称为编码。最简单的编码方式是二进制编码。 具体说就是用沟比特的二进制编码来表示己经量化了的样值,每个二进制数对应一个量化电平,然后把它们排列,得到由二 值脉冲串组成的数字信息流。用这样方式组成的二值脉冲的频率等于采样频率与量化比特数的乘积,称为数字信号的数码率 。采样频率越高,量化比特数越大,数码率就越高,所需要的传输带宽就越宽。

音频编码方法归纳起来可以分成三大类:波形编码、参数编码、混合编码。波形编码是尽量保持输入波形不变,即重建的 语音信号基本上与原始语音信号波形相同,压缩比较低;参数编码是要求重建的信号听起来与输入语音一样,但其波形可以 不同,它是以语音信号所产生的数学模型为基础∷的一种编码方法,压缩比较高;混合编码是综合了波形编码的高质量潜力和参数编码的高压缩效率的混合编码的方法,这类方法也是目前低码率编码的方向。

1.音频信号数字化

信号的数字化就是将连续的模拟信号转换成离散的数字信号,一般需要完成采样、量化和编码三个步骤,如图1所示。采 样是指用每隔一定时间间隔的信号样本值序列来代替原来在时间上连续的信号。量化是用有限个幅度近似表示原来在时间上 连续变化的幅度值,把模拟信号的连续幅度变为有限数量、有一定时间间隔的离散值。编码则是按照一定的规律,把量化后 的离散值用二进制数码表示。上述数字化的过程又称为脉冲编码调制(Pulse Code Modulation),通常由A/D转换器来实现 。

图1 音频信号数字化

数字音频信号经过处理、记录或传输后,当需要重现声音时,还必须还原为连续变化的模拟信号。将数字信号转换成模拟 信号为D/A变换。

数字音频的质量取决于采样频率和量化位数。采样频率越高,量化位数越多,数字化后的音频质量越高。

2.音频采样

采样就是从一个时间上连续变化的模拟信号取出若干个有代表性的样本值,来代表这个连续变化的模拟信号。一个在时间 和幅值上都连续的模拟音频信号的函数表示为x(t),采样的过程就是在时间上将函数x(t)离散化的过程。一般的采样是按均 匀的时间间隔进行的。设这一时间间隔为T,则取样后的信号为x(nT),n为自然数。

根据奈奎斯特采样定理:要从采样值序列完全恢复原始的波形,采样频率必须大于或等于原始信号最高频率的2倍。设连 续信号x(t)的频谱为x(f),以采样间隔时间T抽样得到离散信号X(nT),如果满足|f|≤fc时,其中fc是截止频率,即T≤ 1/2f,时,可以由x(nT)完全确定连续信号x(f):

当采样频率为1/2T时。即fN=1/2T时,称fN为佘奎斯特采样频率.

3.音频量化

采样把模拟信号变成了时间上离散的样值序列,但每个样值的幅度仍然是一个连续的模拟量,因此还必须对其进行离散化 处理,将其转换为有限个离散值,才能最终与数码来表示其幅值。量化过程是将采样值在幅度上再进行离散化处理的过程。 所有的采样值可能出现的范围被划分成有限多个量化阶的集合,把凡是落入某个量化阶内的采样值都赋予相同的值,即量化 值。通常这个量化值用二进制来表示,用N位二进制码字可以表示2N个不同的量化电平。存储数字音频信号的比特率为:

I=N.fs

其中的fs是采样率,N是每个采样值的比特数。

表示采样值的二进制的位数为量化位数,它反映出各采样值的精度,如3位能表示采样值的8个等级,8位能反映256个等级 ,其精度为音频信号最大振幅的1/256。量化位数越多,量化值越接近于采样值,其精度越高,但要求的信息存储量就越大 。

根据公式(30-3)可知,要减小比特率I,在fs已经确定的情况下,只能去减少N的值。N的值降低会导致量化的精度降低 ,N的值增加又会导致信息存储量的增加。因此在编码时就需要合理地选择N的值。

均匀量化就是采用相等的量化间隔进行采样,也称为线性量化。用均匀量化来量化输入信号时,无论对大的输入信号还是 小的输入信号都一律采用相同的量化间隔。因此,要想既适应幅度大的输入信号,同时又要满足精度高的要求,就需要增加 采样样本的位数。

非均匀量化的基本思想是对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这 样就可以在满足精度要求的情况下使用较少的位数来表示。其中采样输入信号幅度和量化输出数据之间一般定义了两种对应 关系,一种称为u律压缩算法,另一种称为A律压缩算法。

采用不同的量化方法,量化后的数据量也就不同。因此说量化也是一种压缩数据的方法。

4.音频编码

采样、量化后的信号还不是数字信号,需要把它转换成数字脉冲,这一过程称为编码。最简单的编码方式是二进制编码。 具体说就是用沟比特的二进制编码来表示己经量化了的样值,每个二进制数对应一个量化电平,然后把它们排列,得到由二 值脉冲串组成的数字信息流。用这样方式组成的二值脉冲的频率等于采样频率与量化比特数的乘积,称为数字信号的数码率 。采样频率越高,量化比特数越大,数码率就越高,所需要的传输带宽就越宽。

音频编码方法归纳起来可以分成三大类:波形编码、参数编码、混合编码。波形编码是尽量保持输入波形不变,即重建的 语音信号基本上与原始语音信号波形相同,压缩比较低;参数编码是要求重建的信号听起来与输入语音一样,但其波形可以 不同,它是以语音信号所产生的数学模型为基础∷的一种编码方法,压缩比较高;混合编码是综合了波形编码的高质量潜力和参数编码的高压缩效率的混合编码的方法,这类方法也是目前低码率编码的方向。


相关内容

  • 从有损到无损的音频编解码框架
  • igital Si g nal Processing 文章编号:1002-8684(2010)12-0060-05 数字信号处理 AVS 无损音频编解码技术 从有损到无损的音频编解码框架 杨新辉1,舒海燕2,曲天书3,张 涛4,窦维蓓 5 论文·· (1. 中科开元信息技术(北京)有限公司,北京10 ...

  • 小波域心理听觉模型
  • 第39卷第ll期哈尔滨工业大学学报VoL39N饥112OO7年11月JOURNALOFHARBININS'n'兀JTEOFTECHNOLOGYNov.200r7 小波域心理听觉模型 谭建国,张文军 (上海交通大学图像通信与信息处理研究所,上海200030,E-mail:tjg@sjtu.edu.cn ...

  • 采用ITU-T标准的商用音频压缩编码系统研究
  • 提要声音信号的存储与传输,从模拟信号到数字信号经历了一个革命性的发展.随着多媒体处理技术的发展,数字音频压缩编码技术得到了广泛应用.从1972年开始ITU-T为音频信号压缩编码制定的一系列标准,成为当前移动通讯.数字卫星系统.网络广播等领域广泛采用的音频压缩编码技术和标准. 关键词:声音信号;音频压 ...

  • 音频编码技术及广播电台数字编码压缩传输系统建设
  • 摘 要 随着广播电视数字化技术的迅猛发展,数字音频压缩编码技术已在广电领域得到广泛应用.本文介绍了音频编码的分类.原理.现行主流标准以及我国自主研发的DRA数字音频编码标准.同时以广播电台为实例,对播出音频信号的数字编码压缩传输系统进行了简要介绍. 关键词 数字化:音频编码:DRA:压缩传输 中图分 ...

  • 多媒体技术基础与应用简答论述题
  • 多媒体技术基础与应用简答论述题 1-7 7.简述多媒体计算机的关键技术及其主要应用领域? 答:多媒体计算机的关键技术是:(1)视频音频信号获取技术:(2)多媒体数据压缩编码和解码技术: (3)视频音频数据的实时处理和特技:(4)视频音频数据的输出技术. 多媒体技术促进了通信.娱乐和计算机的融合.多媒 ...

  • 信号与系统应用论文
  • 数字电视机顶盒的内部系统信号处理过程及其特性研究 1 周朔 (北京工业大学 实验学院,北京,101101) 2 摘要 目的:为了研究数字电视机顶盒内部信号处理的过程及其特点.方法:运用了原理列举法 公式推导法等进行研究.结果:(1)数字电视机顶盒处理信号的原理很简单:(2)数字电视机顶盒处理信号的过 ...

  • 多媒体视频格式
  • 1.AVI格式 它的英文全称为Audio Video Interleaved,即音频视频交错格式.它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知.所谓"音频视频交错",就是可以将视频和音频交织在一起进行同步播放.这种视频格式的优点是图像质 ...

  • [多媒体技术]课程标准
  • <多媒体技术及应用>课程标准 一.课程代码:022386 二.适用专业:适用于计算机多媒体专业. 三.课程性质 <多媒体技术与应用>是计算机多媒体专业方向必修课,属于计算机多媒体专业的基本理论和基本知识,是计算机多媒体专业的一门实践性较强的技术基础课.多媒体技术及是计算机多媒 ...

  • 浅谈音频信号的几种传输模式
  • 摘 要:随着电视节目播出形式.播出内容等的不断发展,广播设备及技术也在不断的飞速发展.本文着重介绍了音频信号传输的集中方式,如调频发射机.电话耦合器.ISDN方式.数字音频传输.海事卫星.光纤传输等方式的基本原理,以及各自的优缺点和适合应用的范围. 关键词:调频发射机:ISDN方式:数字音频传输:传 ...