在制作机器学习数据集的时候,尤其是图片数据集的时候,可能会感到十分的繁琐,本文将介绍简化标注流程的一种思路。
1.收集数据集,清理数据集
2.手动标注部分数据集
3.将标注好的数据集用自己的模型训练
4.将未标注数据用模型进行预测,输出预测文件
5.将预测的数据重新导入标注工具,进行人工调整
接下来,介绍一个个人使用的,觉得比较方便标注工具CVAT
1.标注类型
边界框——识别追踪任务
多边形——分割任务
折线
点——用于标注姿势估计
2.标注格式
支持COCO,PASCAL VOC,YOLO…等多种数据格式的方便的导入导出。
3.标注辅助工具
(1) 边缘吸附
(2) 调节亮度
(3) 追踪
4.团队标注
(1)成员管理:成员注册,分组管理
(2)项目任务管理:添加项目,分发任务
5.相关链接
CAVT中文用户指南:https://blog.51cto.com/u_14691718/5063951
英文官方文档:https://openvinotoolkit.github.io/cvat//docs/
项目github地址:https://github.com/openvinotoolkit/cvat