python利用文件夹下xml格式标签文件批量裁剪出图片中的目标（文件夹、图片名称、目标框数量无限制，逐行注释）

这段时间有个小任务是提取出图片中的手部物体，然后我就用labelimg打标软件给部分图片打了标（生成xml标签文件），顺手写了个小脚本将这些目标从原图中裁剪出来，效果如下所示，感觉还可以。

原始图片（实例1）：
在这里插入图片描述
裁剪效果（实例1）：

原始图片（实例2）：

裁剪效果（实例2，此处空手为打标，故未裁剪）：

完整代码

本代码针对以下问题均有解决：

1、同一xml文件有多个目标框；
2、图片和xml文件在不同或相同文件夹下；
3、部分图片未打标，对应的xml文件不存在；
4、图片文件夹中有非图片（png，jpg）文件；
5、图片命名无规律

import cv2
import xml.etree.ElementTree as ET
import os 

img_path = r'D:\Dataset\HoldingObject\11\color_S000C000P001R000A011' #图片路径
xml_path = r'D:\Dataset\HoldingObject\11\color_S000C000P001R000A011' #标签路径
obj_img_path = r'D:\Dataset\HoldingObject\11\11-1'   #目标裁剪图片存放路径

for img_file in os.listdir(img_path):    #遍历图片文件夹
    if img_file[-4:] in ['.png', '.jpg']:    #判断文件是否为图片格式
        img_filename = os.path.join(img_path, img_file)  #将图片路径与图片名进行拼接
        img_cv = cv2.imread(img_filename)  #读取图片
        
        img_name = (os.path.splitext(img_file)[0])  #分割出图片名，如“000.png” 图片名为“000”
        xml_name = xml_path + '\\' + '%s.xml'%img_name  #利用标签路径、图片名、xml后缀拼接出完整的标签路径名
        
        if os.path.exists(xml_name):  #判断与图片同名的标签是否存在，因为图片不一定每张都打标
            root = ET.parse(xml_name).getroot() #利用ET读取xml文件
            count = 0 #目标框个数统计，防止目标文件覆盖
            for obj in root.iter('object'):  #遍历所有目标框
                name = obj.find('name').text   #获取目标框名称，即label名
            
                xmlbox = obj.find('bndbox')   #找到框目标
                x0 = xmlbox.find('xmin').text  #将框目标的四个顶点坐标取出
                y0 = xmlbox.find('ymin').text
                x1 = xmlbox.find('xmax').text
                y1 = xmlbox.find('ymax').text
                
                obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)]  #cv2裁剪出目标框中的图片
                
                cv2.imwrite(obj_img_path + '\\' + '%s_%s'%(img_name, count) + '.jpg', obj_img)  #保存裁剪图片
                count += 1 #目标框统计值自增1

python利用文件夹下xml格式标签文件批量裁剪出图片中的目标（文件夹、图片名称、目标框数量无限制，逐行注释）

这段时间有个小任务是提取出图片中的手部物体，然后我就用labelimg打标软件给部分图片打了标（生成xml标签文件），顺手写了个小脚本将这些目标从原图中裁剪出来，效果如下所示，感觉还可以。

完整代码

本代码针对以下问题均有解决：

猜你喜欢