一、学习内容
1. 概要
- 对心音信号进行降噪处理:(一周)传送门
采用谱减法、维纳滤波、LMS滤波、NLMS滤波,对心音信号进行降噪
选用残余噪声、归一化均方根MRMS、相关系数、信噪比的指标,对LMS和NLMS降噪效果进行比较 - 对异常心音进行识别:(一周ing)
采用MFCC,做特征提取
学习HMM隐马尔科夫模型
2. 遇到的问题
- 对降噪效果的评价,十分简单,应该学习更全面的评价内容
- 对LMS和NLMS,误差曲线画不出来(尝试了很多,不知道问题出在哪里,打算等开学问一下师兄)
3. 具体内容
- 降噪处理
谱减法:利用加性噪声与语音不相关的特点,在假设噪声是统计平稳的前提下,用无语音间隙测算到的噪声频谱估计值取代有语音期间噪声的频谱,与含噪语音频谱相减,从而获得语音频谱的估计值。
输入:
% signal输入的信号序列 (列向量)
% NIS 前导无话段帧数 (标量)
% fn 帧数 (标量)
% wlen 帧长 (标量)
% inc 帧移 (标量)
% a 过减因子 (标量)
% b 增益补偿因子 (标量)
输出:
% output_subspec 谱减法输出波形(列向量)
维纳滤波:
在最小均方误差准则下(MSE),对语音信号进行估计。
输入:
%x 含噪语音信号
%IS 前导无话段时长
%T1 判断是否有话的阈值
输出:
% 增强语音信号
LMS滤波
以已知期望响应和滤波器输出信号之间误差的均方值最小准则,根据输入信号在迭代过程在估计梯度矢量,并更新权重系数,已达到最优。(梯度最速度下降法)
输入:
% xn 输入的信号序列 (列向量)
% dn 所期望的响应序列 (列向量)
% M 滤波器的阶数 (标量)
% mu 收敛因子(步长) (标量)
输出:
% W 滤波器的权值矩阵 (矩阵)
% 大小为M x itr,
% e 误差序列(itr x 1) (列向量)
% y 实际输出序列 (列向量)
MFCC
关键在于采用Mel滤波器组,更符合听觉特性机理
HMM隐马尔科夫
根据观测值,建立HMM模型(A,B,π),预测状态值
train:由“观测值”,找到最可能产生“观测值”的HMM模型(EM+前向后向算法)
test:由“观测值”和HMM模型,得到最佳的“状态值”(Viterbi)
4.反思
学习HMM原理时,刚开始直接去学公式推导,没有捋清楚清楚它解决问题的思路,在之后去实际应用中发现自己不太理解,才返回去继续看。
因此,在之后学习类似算法,应该先了解清楚
解决的问题是什么,解决的思路是什么,之后再去关注细节的公式推导。
多问为什么,不要太过于着急。
二、下周计划
使用2016年Physionet的心音数据“train-a”,用HMM进行异常分类