interval文件
每个句子会有一个interval文件,对应到句中每个发音的间隔
比如
0
3.63
<exists> 语音总长度
1
"IntervalTier"
"B001_TTS000080.interval"
0
3.63 0-3.63是语音总长度
36 一共有36个silence+phone+st(句中停顿)
0.0
0.38
"sil" 0-0.38时长对应的是silence(句子首末的静音段用sil表示)
0.38
0.43
"iang4" 0.38-0.43对应的是‘iang‘的四声发音
prosody
韵律的划分,整个数据集会写到一个文件中
B001_TTS000020 樱桃的#1味道#1实在#1太美了#3又酸#1又甜#4
ying1 tao2 de5 wei4 dao4 shi2 zai4 tai4 mei3 le5 you4 suan1 you4 tian2
中间用韵律符号划分
#1 韵律停顿
#2 介于#1 和#3之间的停顿
#3 韵律短语停顿
#4 句子的停顿,比如感叹号,句号,问号的结束
不仅是停顿时间的客观比较,还有一些主观的含义在里边
TTS前端会根据文本解析出应该在什么地方停顿,但也会有一定的误差