版权声明:欢迎关注公众号:AI蜗牛车 || 本文为博主原创文章,未经博主允许不得转载, 若转载请与我联系。 https://blog.csdn.net/qq_33431368/article/details/89791859
前提场景
在计算机视觉的场景下,如果是目标检测,肯定是需要 图片文件和对应的目标检测的标注文件,如果是VOC格式那就是xml文件,但是出现的问题就是我目前想做图像增加,需要对图片进行对应的批量的旋转等操作,所以需要得到目前这些文件的路径才能进行修改,但是因为前期收集数据的时候会出现有的图片本来就没有目标物体所以不存在xml文件,有的是存在xml文件,但是命名不小心更改了,这里需要操作只找文件image和xml的文件前缀的交集
即 . 之前的string name的交集,图中就是 che, hongshu两个.
解决代码
其实有很多种解决方式,比如直接遍历等等,但是那样的效率太低了,这里采用dict来处理。
代码如下:
import os
image_path = './input/image'
xml_path = './input/xml'
image_list = os.listdir(image_path)
xml_list = os.listdir(xml_path)
image_name_path = dict([])
for image in image_list:
if image_name_path.get(image.split('.')[0], None) == None:
image_name_path[image.split('.')[0]] = 1
for xml in xml_list:
if image_name_path.get(xml.split('.')[0], None) == 1:
image_name_path[xml.split('.')[0]] = 0
image_name_path_list = []
for key, value in image_name_path.items():
if value == 0:
image_name_path_list.append(key)
print(image_name_path_list)
结果如下:
接下来运用list进行遍历即可每个image和xml文件都能一一对应的操作,属于string的交集操作