个人课题:言语评估

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/MrWilliamVs/article/details/88996991

emotion: 情感,情绪,主观的。label一般是:happy、sad、angry
sentiment: 态度,情绪,意见。positive、negative,nature

课题数据集处理:
数据情况:
训练集+验证集:2783;测试集(相同题目):299,测试集(不同题目):344。

初步, 类标先不平衡, 直接去学,看整体打分预测效果怎样。
类标选择二人取平均、

最终生成:
train,
dev,
test,

nlp_trans.npy(每一条数据的文本)
label(数据的标签)
audio_mfcc(音频特征)
seqN(mfcc的长度)
audio_prosody(韵律特征)

中文词向量,对于不存在的词,随机初始向量,设为可训练的。

audio特征提取:
直接一条完整的音频,19858长度,10M左右
原始长度:1423左右。

修改MFCC12EDA_conf参数:frameSize 0.025 -> 0.25, frameStep 0.01 -> 0.1
长度变为1984

mfcc需要后处理:
每行 39维,

(n, row, col),n指数据个数, 后面两个为每条数据的mfcc特征维度(750, 39)

row>750,只取750. (数据需要统计)
现在,2783 * 2377 * 39

猜你喜欢

转载自blog.csdn.net/MrWilliamVs/article/details/88996991