语音压缩编码

原因：

语音信号编码最简单的方式是直接将语音信号进行量化，只要量化位数足够多，就能保证解码后语音信号有很好的音质。缺点是这样所需的数码率太高，传输信道难以承受。因此必须对语音信号进行压缩编码

信源编码主要解决有效性的问题，也就是数据压缩的问题，以最少的数码表述信源所发的信号，减少容纳给定信息集合或数据采样集合的信号空间。信道编码主要解决可靠性问题，即尽量使处理过的信号在传输的过程中不出错或少出错，即使出了错也要能自动检错和尽量纠错。因此本章主要讲信源编码

依据语音信号的冗余度和人的听觉感知机理。

1）幅度非均匀分布。小幅度样本出现的概率高。
2）对于短时自相关函数，相邻样本间的相关性很强。
3）浊音语音段具有准周期性。
4）声道的形状及其变化缓慢。
5）存在语音间隙。

1）非均匀的长时功率谱密度。高频能量较低，对应于时域上相邻样本间的相关性。
2）对于短时功率谱密度，整个谱随着频率增加而递减。整个谱形成基于基音频率的高次谐波结构。共振峰频率处能量较大。

1）掩蔽效应。高声级单音会掩蔽临近频率声音。可用于抑制与信号同时存在的量化噪声。
2）人耳对不同频段声音的敏感程度不同。人的听觉对低频段比较敏感，对高频段不太敏感。
3）人耳对语音信号的周期性（即音调）极为敏感，而对相位变化不敏感。

上限：语音压缩编码的极限速率（下限）为80~100bps

技术：
（1）线性预测
在这里插入图片描述
短时相关性使用以下模型来描述：

长时相关性使用以下模型来描述：

一般来说，长时预测系数的个数在1（q=r=0）到3（q=r=1）之间

在这里插入图片描述
（2）合成分析法：将综合器引入编码器，使之与分析器相结合，在编译器中生成和译码端完全一致的语音。将次合成语音与原始语音相比较，根据一定的误差原则，来调整计算各个参数，使得两者之间的误差最小。

（3）感觉加权滤波器：

理想的编码器应该是低速率、高语音质量、低时延、高误码容限、低复杂度、具有良好的健壮性和算法可扩展性。
客观评价的方法有信噪比，主观评价的方法有可懂度评价、音质评分

在这里插入图片描述