合成知识01

interval文件

每个句子会有一个interval文件,对应到句中每个发音的间隔
比如

0
3.63
<exists>   语音总长度
1
"IntervalTier"
"B001_TTS000080.interval"
0
3.63    0-3.63是语音总长度
36      一共有36个silence+phone+st(句中停顿)
0.0
0.38
"sil"   0-0.38时长对应的是silence(句子首末的静音段用sil表示)
0.38
0.43
"iang4"   0.38-0.43对应的是‘iang‘的四声发音
prosody

韵律的划分,整个数据集会写到一个文件中

B001_TTS000020  樱桃的#1味道#1实在#1太美了#3又酸#1又甜#4
ying1 tao2 de5 wei4 dao4 shi2 zai4 tai4 mei3 le5 you4 suan1 you4 tian2

中间用韵律符号划分
#1 韵律停顿
#2 介于#1 和#3之间的停顿
#3 韵律短语停顿
#4 句子的停顿,比如感叹号,句号,问号的结束
不仅是停顿时间的客观比较,还有一些主观的含义在里边

TTS前端会根据文本解析出应该在什么地方停顿,但也会有一定的误差

发布了98 篇原创文章 · 获赞 9 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/100030518