LiveVideoStack线上分享第五季(九):语音合成中的风格控制

目前,语音合成领域的风格情感控制是一个比较热门的话题,它将决定着语音合成中的似人度和灵活性以及可转换性。5月4日晚 20:00LiveVideoStack线上分享第五季,第八期,我们邀请到了喜马拉雅 音频算法工程师 贺雯迪分享语音合成的基本模块以及风格迁移的概念,详解基于Multihead-Attention的Global style token算法原理以及现在目前比较值得探索的变分自编码器在语音合成中对说话人风格控制的应用。

嘉宾简介

贺雯迪 喜马拉雅 音频算法工程师

爱丁堡大学人工智能硕士,喜马拉雅音频算法工程师。研发经历:TTS前端模块(文本正则、分词算法、韵律预测等),后端算法(基于深度生成模型VAE的说话人风格控制、音色转换、音色克隆、few-shot learning、神经声码器的优化等)。

关于LiveVideoStack线上交流分享

为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践。我们推出了LiveVideoStack线上交流分享活动,邀请业内资深技术专家进行线上分享技术干货,解答热点问题。你可以通过以下方式参与:

  • 扫描图中二维码关注LiveVideoStack公众号【livevideostack

  • 回复“分享”,即可获得进入直播群的方式

原创文章 505 获赞 369 访问量 61万+

猜你喜欢

转载自blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/105897783