语音识别学习笔记(一)【概述】
- 概述:
1)语音识别是机器通过识别和理解过程把人类的语音信号转变成相应的文本或命令的技术。
2)集 声学、语音学、计算机、信息处理、人工智能等于一身的综合技术。 - 难点:
1)语音特征随与之相连的语音的不同而产生很大变化,且连续语音中各单位之间无明显边界;
2)语音特征随发音人生理和心理状态的变化而产生很大差异;
3)环境噪声和传输设备的差异也将影响特征的提取;
4)语义理解带来的困难,如语句表达的意思和上下文,文化背景等相关。 -
分类:
(1)识别:说话人识别和语音识别
(2)说话人识别:
1)从识别技术看:文本无关和文本相关;
2)从用途看:说话人辨认和说话人确认。
(3)语音识别:
1)按词汇量大小:小词汇量(10~100个)、中词汇量(100~500个)和大词汇量(500以上);
2)按发音方式:孤立词识别、连接词识别、连续语音识别和关键词检出;
孤立词识别:
连接词识别:
连续语音识别:
关键词检出:
3)按说话人:特定说话人和非特定说话人。
4)按语音识别方法:模板匹配法、随机模型法和概率语法分析法。 -
识别过程: