接上一篇,这是第二个
2将我司部分视频按照随机index进行抽帧,然后得到inceptionV3 2048avg features
2.1降低维度,采用上一篇的方法PCA或者试试其他方法LDA??
【其实LDA线性判别分析是我在听很多大佬报告时经常听到的,说明经常去听报告还是有好处的,一为认识大佬,混个脸熟;二为交流学问,增长见识;三为混吃混喝,但基本上路费都吃不回来,尴尬;四为相亲,哈哈,开个玩笑,,,,】
此次试试LDA,会不会有很好的聚类效果,拭目以待。
不同于PCA,LDA使得类别之间的差距更大,因此LDA需要标签,如果标签未知呢??
【其实不论PCA或者LDA,sklearn均提供了API,简单好用,如下:
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
我之前有自己实现,采用的特征值分解,而sklearn是采用的SVD分解,大同小异。
这一篇是单独用sklearn PCA实现的MNIST数据特征表示。
百变大魔王探花小明哥,看得了源码,造得出轮子,事无巨细,事必躬亲。
】
鉴于上面LDA的分析,此次仍旧用PCA查看数据类别之间的差距。
PCA后是500,但结果令人失望。其实伪标签012基本上都是1视频,而3是0视频,这就尴尬了。随机抽帧有缺陷??
还是降维有问题【我觉得不是】,那可能就是特征提取的问题了。
基本都有重合。如果非要用inceptionV3特征,那么召回时应选择top3,很少的几个,不然可能就是错误的结果。
也可试试降维后用knn查询。我觉得可行,至少效果是类似的。
所以归根结底还是特征问题,动作特征如果不提取的话,那么可能得到的类别仅仅就是图像的。
另外有相关问题可以加入QQ群讨论,不设微信群
QQ群:868373192
语音图像视频深度-学习群