这个windows下的语音识别是在我做TensorFlow下语音识别之前学习的。后来发现这个准确率不怎么高,并且谷歌推出了开放的平台。决定自己写一个语音识别功能。
以下是我对自己学习的windows下的语音识别的整理。
包括两部分:A:语音识别
B:语音合成
都需要语音引擎的支持
创建语音引擎的两种模式:A:共享的 share
B:独享的 Inproc
一般情况下可以使用共享型,大的服务器使用独享的。
独享的必须设置语音输入。
在这里,我认为的 独享和共享的唯一就是:共享可以使用windows下自带的功能,并且用代码屏蔽不了。独享就只是仅仅在当前程序中使用。
语音识别最关键的是下载语音引擎,才会走自己设定的代码。
在本程序退出时,卸载com平台。
有两种模式:文本模式 。 通过字典,精确度低
命令识别模式。 识别的词汇量减少
****这两种方式的主要区别在于,识别过程中使用的匹配字典不同