基于 RTVC-7 Voice Cloning Model 的 Cross-Lingual TTS 的三步走: 第二步 Tuned-EarSpeech 跨语言实验观察

其他 2021-03-20 19:32:00 阅读次数: 0

0. 说明

把 LJSpeech 的作为 reference, 以及 DataBaker EN 的

首先仍然用 7k 的那个 ckpt
虽然目前训练到了 126k, 但是保持和之前不跨语言的对比, 所以不用 (单独开一篇博客, 记录实验观察 (二))

1. 选取 Reference Speech

1.1. 选取音频

前 6 个是标贝双语, 分别是 2 个中, 2 个英, 2 个混合
然后两个是 LJSpeech
最后四个来源于 VCTK
注意, 采样率有的是 16k, 有的是 48k

1.2. 给张阳帮忙提取 Speaker Embedding

猜你喜欢

转载自blog.csdn.net/u013625492/article/details/114656320

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)