YOLO系列经常用来做视频中的目标识别, 在客制化数据集进行建立的时候也经常基于实际现场视频数据进行进行标注。现场数据大多并非为一个完整稳定录制视频,需要进行剪切获得需要的场景数据,因此产生多段视频数据。数据需要转化为图像后标注与训练,但同时图像标注时label与image名称对应,导致多段视频数据转化后还需要做数据对齐。图像数据中也并非每一帧图像都需要标注,为此需要进行图像抽帧。
对此,提供一个脚本用来将当前文件夹下所有视频数据转换为图像数据,并且进行图像抽帧,图像名称自动对齐。形成统一数据库,用于labelImg标注。
import cv2
import os
#读取视频文件路径, 修改为你的所有视频所在位置
path = "./video"
#保存路径
save_path = "./images" #修改为要保存的图像路径
#初始化
#帧序号
num = 0
#转化后图片序号,抽帧后图片序号与帧序号会不对应
length = 0
#获取所有视频文件列表
dir_list = os.listdir(path)
for file_name in dir_list:
print("current process the video of:"+file_name)
cap = cv2.VideoCapture(path+"/"+file_name)
while True:
ret,mat = cap.read()
if ret:
# 抽帧,8帧抽一帧
if num % 8 == 0:
cv2.imwrite(save_path + str(length) + ".jpg", mat)
length = length + 1
#当前已处理到的图像序号
print(length)
num = num + 1
else:
break