kaldi在数据准备时,使用fix_data_dir.sh对数据进行排序,可能出现如标题所示的错误,此错误一般是由数据命名导致的。总结起来就是注意以下几条:
1. 在sh文本中设置"export LC_ALL=C",一般可在path.sh文件中添加;
2. speaker-id作为utterance-id的前缀(前缀不一定要用短横线隔开)
3. utterance-id及speaker-id中如果有下划线"_"尽量用短横线"-"代替下划线"_"(非必须)
kaldi在数据准备时,使用fix_data_dir.sh对数据进行排序,可能出现如标题所示的错误,此错误一般是由数据命名导致的。总结起来就是注意以下几条:
1. 在sh文本中设置"export LC_ALL=C",一般可在path.sh文件中添加;
2. speaker-id作为utterance-id的前缀(前缀不一定要用短横线隔开)
3. utterance-id及speaker-id中如果有下划线"_"尽量用短横线"-"代替下划线"_"(非必须)