语音信号处理第二章
语音信号处理第三章
语音信号处理第四章
语音信号处理第五章
语音信号处理第七章
语音信号处理第九章
语音信号处理第十章
语音信号处理第十二章
语音压缩编码
只针对考试内容,不全面讲解各类编码
语音压缩编码
原因:
语音信号编码最简单的方式是直接将语音信号进行量化,只要量化位数足够多,就能保证解码后语音信号有很好的音质。缺点是这样所需的数码率太高,传输信道难以承受。因此必须对语音信号进行压缩编码
信源编码主要解决有效性的问题,也就是数据压缩的问题,以最少的数码表述信源所发的信号,减少容纳给定信息集合或数据采样集合的信号空间。信道编码主要解决可靠性问题,即尽量使处理过的信号在传输的过程中不出错或少出错,即使出了错也要能自动检错和尽量纠错。因此本章主要讲信源编码
原理:
依据语音信号的冗余度和人的听觉感知机理。
(1)时域冗余度:
1)幅度非均匀分布。小幅度样本出现的概率高。
2)对于短时自相关函数,相邻样本间的相关性很强。
3)浊音语音段具有准周期性。
4)声道的形状及其变化缓慢。
5)存在语音间隙。
(2)频域冗余度:
1)非均匀的长时功率谱密度。高频能量较低,对应于时域上相邻样本间的相关性。
2)对于短时功率谱密度,整个谱随着频率增加而递减。整个谱形成基于基音频率的高次谐波结构。共振峰频率处能量较大。
(3)人的听觉感知机理:
1)掩蔽效应。高声级单音会掩蔽临近频率声音。可用于抑制与信号同时存在的量化噪声。
2)人耳对不同频段声音的敏感程度不同。人的听觉对低频段比较敏感,对高频段不太敏感。
3)人耳对语音信号的周期性(即音调)极为敏感,而对相位变化不敏感。
上限:语音压缩编码的极限速率(下限)为80~100bps
语音合成系统模型:
技术:
(1)线性预测
短时相关性使用以下模型来描述:
长时相关性使用以下模型来描述:
一般来说,长时预测系数的个数在1(q=r=0)到3(q=r=1)之间
(2)合成分析法:将综合器引入编码器,使之与分析器相结合,在编译器中生成和译码端完全一致的语音。将次合成语音与原始语音相比较,根据一定的误差原则,来调整计算各个参数,使得两者之间的误差最小。
(3)感觉加权滤波器:
评价标准:
理想的编码器应该是低速率、高语音质量、低时延、高误码容限、低复杂度、具有良好的健壮性和算法可扩展性。
客观评价的方法有信噪比,主观评价的方法有可懂度评价、音质评分