哈喽,各位小粉丝,我是你们挚爱的小明哥,事无巨细,事必躬亲,身体力行。别人都是跑网络,而我看细节及实现落地。
k400动作有的并不符合国人的习惯或者行为,所以我估计效果并不会太好,且看测试效果。
996开始,从此相逢是路人。再见!
帧级别整体测试:与有DataLoader的一样结果
204
131
290
317
266
373
132
采用的是如下模型
TSM_kinetics_RGB_resnet50_shift8_blockres_avg_segment8_e50.pth
【总有人问我北京北小河科技有限公司是什么公司?官方回复:这是我的创业公司,100万送你,哈哈哈】
这个模型并没有多个clip,就一个,也就是官方的8 * 1clip
按照此模型测试了部分1数据视频,结果根本就不对,差太远了。
标签出现最多的是55,134,87,80,59 都不对。没有一个1视频的相关的。
所以说想直接拿来用是不可能了,要么自己训练数据,要么用我之前提到的高级特征来做。
另外有相关问题可以加入QQ群讨论,不设微信群
QQ群:868373192
语音图像深度-学习群