语音与音频压缩／解压缩技术

2019-07-23 13:50发布

该问题目前已经被作者或者管理员关闭, 无法添加新回复

18条回答

1988020566

1楼-- · 2019-07-23 14:01

2.1 差分脉冲代码调制 (DPCM)
　　DPCM通过使用当前采样与前一个采样的差值来对模拟音频输入信号进行编码。图 1 显示了DPCM编码器与解码器的结构图。在本例中，我们用信号估算Se(n) 而非前一个输入来决定信号差值d(n)，从而确保了编码器使用的信息与解码器相同。如果编码器使用的是上一个输入采样的话，那么就会造成量化的累积错误，从而使重建信号与原始输入信号不同。通过采用如图 1 所示的信号估算，我们能避免重建信号 Sr(n) 与原始输入信号出现差异。重建信号 Sr(n) 是预测器(predictor) 的输入，其决定了下一个信号估算 Se(n+1)。

图 1. DPCM 编码器与解码器结构图

1988020566

2楼-- · 2019-07-23 16:29

　　图 2 显示了一小段录制音频流，并通过两个示意图给出了模拟音频输入采样（PCM 值）与连续采样（DPCM 值）间差值的比较。
{{分页}}
　　PCM 值的范围在 26 到 203 之间，总共 177 个步长。编码的 DPCM 值范围在 –44 至 46之间，总共 90个步长。尽管量化器步长仅为 1，但这种 DPCM 编码已经实现了输入数据的压缩功能。只需选择较大的量化器步长即可将编码 DPCM值的范围进一步缩小。

1988020566

3楼-- · 2019-07-23 20:34

图 2. 8 位音频数据与连续采样差值的比较

1988020566

4楼-- · 2019-07-23 22:53

2.2适应差分脉冲编码调制 (ADPCM)
　　ADPCM 是 DPCM的一个变体，编码器步长会有差异。语音输入信号的强度差异体现在不同的扬声器器上，也体现在语音输入信号的语音和非语音部分上。量化器步长对每个采样都进行适应调节，确保高低输入信号强度都能实现同样的编码效率。图 3 显示了采用步长调节技术的修订版 DPCM结构图。