1.简介:
RLSD出自论文《Multi-label Image Classifification with Regional Latent Semantic Dependencies》中,即Regional Latent Semantic Dependencies。
RLSD可以看做是CNN+RPN(region proposal network)+LSTM. 用于多标签图片分类,即识别一张图片中的多个物体与类别。CNN采用的VGGNET。
所以RLSD在效果方面比CNN+RNN(LSTM)会好些,尤其是在小物体检测方面,因为其关注RPN上的标签依赖关系,而不是整个图片层的标签依赖关系。
另外,实验结果也比Multi-label CNN、HCP效果好。
2.模型结构