音频一般特征提取embedding问题终结篇(高级泛化特征+低级明确含义特征)

音频特征提取博文:第一个第二个第三个第四个第五个第六个。。。人生艰难啊

这个问题今天必须终结了,如果不终结的话我就没有任何价值了,天天搞些乱七八糟的的东西,而没有任何实质性进展,我的坑估计都保不住了,领导都心知肚明。

归根结底的问题是什么?

提取整个音频的特征,而且最终维度要小,并且有一定的特征代表性,不能提取的特征最后一看都是很混乱,散点图分的很开,该是一类的没有在一个簇,这不是扯淡吗?

上面的博客都是特征融合做的不行,维度大。

下面的请vip来看吧。

猜你喜欢

转载自blog.csdn.net/SPESEG/article/details/105159610