搭建自定义目标检测数据集时的要求

来源 https://github.com/ultralytics/yolov5/issues/8157

大多数情况下,无需更改模型或训练设置即可获得良好的结果,前提是数据集足够大且标记良好。如果一开始没有得到好的结果,你可以采取一些步骤来改进,但我们始终建议用户在考虑任何更改之前先使用所有默认设置进行训练。这有助于建立性能基线并发现需要改进的领域。

如果您对训练结果有疑问,我们建议您提供尽可能多的信息(如果您希望得到有用的响应),包括结果图(列车损失、价值损失、P、R、mAP)、PR 曲线、混淆矩阵、训练镶嵌、测试结果和数据集统计图像,例如标签.png。所有这些都位于您的目录中,通常为 .project/nameyolov5/runs/train/exp

我们为希望在下面的 YOLOv5 培训中获得最佳结果的用户整理了一份完整的指南。

数据

  1. 每个类的图像。建议每类≥ 1500 张图像
  2. 每个类的实例数。建议每个类≥ 10000 个实例(标记对象)
  3. 图像多样性。必须代表已部署的环境。对于现实世界的用例,我们建议使用一天中不同时间、不同季节、不同天气、不同照明、不同角度、不同来源(在线抓取、本地收集、不同相机)等的图像。
  4. 标签一致性。必须标记所有映像中所有类的所有实例。部分标记将不起作用。
  5. 标签准确性。标签必须紧紧包围每个对象。对象与其边界框之间不应存在空格。任何对象都不应缺少标签。
  6. 标签验证。在火车起点上查看以验证您的标签是否正确显示,即参见示例马赛克。train_batch*.jpg
  7. 背景图像。背景图像是没有对象的图像,这些对象被添加到数据集以减少误报 (FP)。我们建议大约 0-10% 的背景图像来帮助降低 FP(COCO 有 1000 张背景图像供参考,占总数的 1%)。背景图像不需要标签。

猜你喜欢

转载自blog.csdn.net/qq_41823532/article/details/131699088