音频编码过程

1．音频信号数字化

信号的数字化就是将连续的模拟信号转换成离散的数字信号，一般需要完成采样、量化和编码三个步骤，如图1所示。采样是指用每隔一定时间间隔的信号样本值序列来代替原来在时间上连续的信号。量化是用有限个幅度近似表示原来在时间上连续变化的幅度值，把模拟信号的连续幅度变为有限数量、有一定时间间隔的离散值。编码则是按照一定的规律，把量化后的离散值用二进制数码表示。上述数字化的过程又称为脉冲编码调制（Pulse Code Modulation），通常由A/D转换器来实现。

图1 音频信号数字化

数字音频信号经过处理、记录或传输后，当需要重现声音时，还必须还原为连续变化的模拟信号。将数字信号转换成模拟信号为D/A变换。

数字音频的质量取决于采样频率和量化位数。采样频率越高，量化位数越多，数字化后的音频质量越高。

2．音频采样

采样就是从一个时间上连续变化的模拟信号取出若干个有代表性的样本值，来代表这个连续变化的模拟信号。一个在时间和幅值上都连续的模拟音频信号的函数表示为x(t)，采样的过程就是在时间上将函数x(t)离散化的过程。一般的采样是按均匀的时间间隔进行的。设这一时间间隔为T，则取样后的信号为x（nT），n为自然数。

根据奈奎斯特采样定理：要从采样值序列完全恢复原始的波形，采样频率必须大于或等于原始信号最高频率的2倍。设连续信号x（t）的频谱为x(f),以采样间隔时间T抽样得到离散信号X(nT），如果满足|f|≤fc时，其中fc是截止频率，即T≤ 1/2f，时，可以由x（nT）完全确定连续信号x(f)：

当采样频率为1/2T时。即fN=1/2T时,称fN为佘奎斯特采样频率.

3．音频量化

采样把模拟信号变成了时间上离散的样值序列，但每个样值的幅度仍然是一个连续的模拟量，因此还必须对其进行离散化处理，将其转换为有限个离散值，才能最终与数码来表示其幅值。量化过程是将采样值在幅度上再进行离散化处理的过程。所有的采样值可能出现的范围被划分成有限多个量化阶的集合，把凡是落入某个量化阶内的采样值都赋予相同的值，即量化值。通常这个量化值用二进制来表示，用N位二进制码字可以表示2N个不同的量化电平。存储数字音频信号的比特率为：

I=N.fs

其中的fs是采样率，N是每个采样值的比特数。

表示采样值的二进制的位数为量化位数，它反映出各采样值的精度，如3位能表示采样值的8个等级，8位能反映256个等级，其精度为音频信号最大振幅的1/256。量化位数越多，量化值越接近于采样值，其精度越高，但要求的信息存储量就越大。

根据公式（30－3）可知，要减小比特率I，在fs已经确定的情况下，只能去减少N的值。N的值降低会导致量化的精度降低，N的值增加又会导致信息存储量的增加。因此在编码时就需要合理地选择N的值。

均匀量化就是采用相等的量化间隔进行采样，也称为线性量化。用均匀量化来量化输入信号时，无论对大的输入信号还是小的输入信号都一律采用相同的量化间隔。因此，要想既适应幅度大的输入信号，同时又要满足精度高的要求，就需要增加采样样本的位数。

非均匀量化的基本思想是对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，这样就可以在满足精度要求的情况下使用较少的位数来表示。其中采样输入信号幅度和量化输出数据之间一般定义了两种对应关系，一种称为u律压缩算法，另一种称为A律压缩算法。

采用不同的量化方法，量化后的数据量也就不同。因此说量化也是一种压缩数据的方法。

4．音频编码

采样、量化后的信号还不是数字信号，需要把它转换成数字脉冲，这一过程称为编码。最简单的编码方式是二进制编码。具体说就是用沟比特的二进制编码来表示己经量化了的样值，每个二进制数对应一个量化电平，然后把它们排列，得到由二值脉冲串组成的数字信息流。用这样方式组成的二值脉冲的频率等于采样频率与量化比特数的乘积，称为数字信号的数码率。采样频率越高，量化比特数越大，数码率就越高，所需要的传输带宽就越宽。

音频编码方法归纳起来可以分成三大类：波形编码、参数编码、混合编码。波形编码是尽量保持输入波形不变，即重建的语音信号基本上与原始语音信号波形相同，压缩比较低；参数编码是要求重建的信号听起来与输入语音一样，但其波形可以不同，它是以语音信号所产生的数学模型为基础∷的一种编码方法，压缩比较高；混合编码是综合了波形编码的高质量潜力和参数编码的高压缩效率的混合编码的方法，这类方法也是目前低码率编码的方向。