whisper介绍
Whisper 是一个由 OpenAI 训练并开源的神经网络,功能是语音识别,能把语音转换为文字,在英语语音识别方面的稳健性和准确性接近人类水平。
1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全符合工业准确率标准,未来有望打开商业化空间;
2、Whisper模型根据参数量和语言不同,共有9种版本,可适应不同使用者的需求。在中文语料测试下,模型在语音识别、语气识别、自动断句等方面表现出色,可满足各类使用场景需求;
C++版开源地址
https://github.com/ggerganov/whisper.cpp
.bin 模型下载地址
https://huggingface.co/ggerganov/whisper.cpp
python版开源地址
https://github.com/openai/whisper
桌面客户端 WhisperDesktop.exe 下载地址
https://github.com/Const-me/Whisper/releases
通过它直接调用模型
.pt 模型下载地址
链接:https://pan.baidu.com/s/1nj174s3tyHUAsazi4tHW0g
提取码:3ugi