想实现一个功能,统计目标检测数据集中,目标的平均宽、高、面积,以及目标面积与原图面积比例的情况。目的是可以对数据集的情况有一些感性的认识。
代码逻辑
'''
1.读取路径下的xml文件名,并保存为列表
2.循环
1)按文件名字列表分别读取xml和jpg
2)针对每一个xml,循环
a.读取每一个object的属性,记录一下信息读取每一个object的属性,记录一下信息
目标名字、目标的坐标
计算坐标的长宽
b.读取名字对应的jpg文件
获取图像的长、宽
计算图像的面积
c.计算一下几个量
针对每一类,计算目标的平均长度、平均宽度,目标和图像的长度比值、宽度比值、平均面积、平均占比
‘’‘’
下面是代码
# -*- coding:utf-8 -*-
import os
import xml.etree.ElementTree as ET
import numpy as np
np.set_printoptions(suppress=True, threshold=np.nan)
import matplotlib
from PIL import Image
def parse_obj(xml_path, filename):
tree=ET.parse(xml_path+filename)
objects=[]
for obj in tree.findall('object'):
obj_struct={}
obj_struct['name']=obj.find('name').text
bbox=obj.find('bndbox')
obj_struct['bbox']=[int(bbox.find('xmin').text),
int(bbox.find('ymin').text),
int(bbox.find('xmax').text),
int(bbox.find('ymax').text)]
objects.append(obj_struct)
return objects
def read_image(image_path, filename):
im=Image.open(image_path+filename)
W=im.size[0]
H=im.size[1]
area=W*H
im_info=[W,H,area]
return im_info
if __name__ == '__main__':
image_path='../JPEGImages/'
xml_path='../Annotations/'
filenamess=os.listdir(xml_path)
filenames=[]
for name in filenamess:
name=name.replace('.xml','')
filenames.append(name)
print(filenames)
recs={}
ims_info={}
obs_shape={}
classnames=[]
num_objs{}
obj_avg={}
for i,name in enumerate(filenames):
print('正在处理 {}.xml '.format(name))
recs[name]=parse_obj(xml_path, name+ '.xml' )
print('正在处理 {}.jpg '.format(name))
ims_info[name]=read_image(image_path, name + '.jpg' )
print('所有信息收集完毕。')
print('正在处理信息......')
for name in filenames:
im_w = ims_info[name][0]
im_h = ims_info[name][1]
im_area = ims_info[name][2]
for object in recs[name]:
if object['name'] not in num_objs.keys():
num_objs[object['name']]=1
else:
num_objs[object['name']]+=1
num_objs+=1
ob_w = object['bbox'][2] - object['bbox'][0]
ob_h = object['bbox'][3] - object['bbox'][1]
ob_area = ob_w*ob_h
w_rate= ob_w / im_w
h_rate= ob_h / im_h
area_rate= ob_area / im_area
if not object['name'] in obs_shape.keys():
obs_shape[object['name']]=( [[ob_w,
ob_h,
ob_area,
w_rate,
h_rate,
area_rate]] )
else:
obs_shape[object['name']].append( [ob_w,
ob_h,
ob_area,
w_rate,
h_rate,
area_rate] )
if object['name'] not in classnames:
classnames.append(object['name'])#求平均
for name in classnames:
obj_avg[name]=(np.array(obs_shape[name]).sum(axis=0))/num_objs[name]
print('{}的情况如下:*******\n'.format(name))
print(' 目标平均W={}'.format(obj_avg[name][0]))
print(' 目标平均H={}'.format(obj_avg[name][1]))
print(' 目标平均area={}'.format(obj_avg[name][2]))
print(' 目标平均与原图的W比例={}'.format(obj_avg[name][3]))
print(' 目标平均与原图的H比例={}'.format(obj_avg[name][4]))
print(' 目标平均原图面积占比={}\n'.format(obj_avg[name][5]))
print('信息统计计算完毕。')
#计算每一个目标在原图中的占比
#计算目标的平均长度、
#计算平均宽度,
#计算平均面积、
#计算目标平均占比
输出结果如下:
还有一个想法就是,对于场景固定的数据,可以在一张空画布上把目标都画出来,直观感受一下目标的分布情况。都基本出现在什么位置。代码里面记录了获取了其他很多信息,可以扩展出其他的统计功能。比如绘制图像大小分布如下图:
可以看到数据集的图像主要集中在500~1000的长、宽范围内。
---画图的代码
#-*- coding:utf-8 -*-
......
from PIL import Image
import matplotlib.pyplot as plt
......
if __name__ == '__main__':
......
height=[]#1
weight=[]#2
......
im_w = ims_info[name][0]
im_h = ims_info[name][1]
weight.append(im.size[0])#3
height.append(im.size[1])#4
......
......
x = np.array(tuple(height))#5
y = np.array(tuple(weight))#6
fig = plt.figure(0)#7
plt.xlabel('x')#8
plt.ylabel('y')#9
plt.title('长宽分布')
plt.scatter(y, x, c='red', alpha=1, marker='.', label='样本') # c='red'定义为红色,alpha是透明度,marker是画的样式
plt.grid(True)
plt.legend(loc='best')
plt.show()