测试OverFeat特征点质量
该测试主要针对OverFeat提取商品 特征的精度的测试,忽略了OverFeat提取特征点时间消耗、图片匹配的时间等因素。
测试环境
主机名 | 配置 |
---|---|
test75 | Intel® Xeon® 1.80GHz, 8核,16线程,内存 8G, 硬盘 200G |
测试数据
为了测试OverFeat提取特征点的质量,采用从XX商城爬取的箱包、作为测试数据库,测试OverFeat提取特征点的效果。上述测试数据库的信息如所示。
数据库名称 | 描述 |
---|---|
XX商城箱包 | XX商城箱包频道抓取图片,数据集大小为10000×5,10000件商品,每件商品3~8张图片,图像分辨率为221×221 |
测试方法
从数据集中随机的抽取10000件商品作为训练集,然后再从剩下数据集中随机选取100件商品,对每件商品的图片中选择1张加入测试集,其余图片加入训练集。用测试集中图片匹配训练集中图片,比较匹配的结果,并将相似度最高测top 10作为输出。
测试结果及分析
使用OverFeat提取特征点
采用accuracy OverFeat CNN网络模型,将第一个全联接层(第22层)作为图像的特征点。其中,第22层输出为一个4096维的向量,即一张图片通过accuracy OverFeat可以提到1个4096维的特征点。提取10000件商品(50000多张图片)的特征点共耗时24小时,并且采用多进程并行提取。
两张图片的匹配
两张图片提取特征点后,先对图片的特征点进行归一化,然后计算两张图片特征点的L2距离,并将L2距离作为两张图片的相似度(相似度越小,两张图片越相似)。
数据集在OverFeat提点+暴力匹配测试结果
OverFeat提点+暴力匹配测试部分结果如下表所示(如果想得到更多测试结果请给我留言)。
编号 | 测试图片 | 匹配图片 |
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 | ||
9 | ||
10 |
由表可以看出,OverFeat提取的特征点在颜色、形状、商品类型上有很好的区分度,这是由于OverFeat在学习过程中学习到了商品颜色、形状等特征,并且由于采用Softmax分类器作为输出层,对商品分类效果有很好的保证。