文本检测数据集以及标签形式说明
icdar15系列,带角度的四边形标签
打开标签文件,每行为一个文本框坐标以及语言类型,文字,###代表模糊不清
形式,是四边形的四个点的坐标。
ctw1500系列任意形状的数据集标签
每行共32个数字,前四个数字为该弯曲文本在整张图上的矩形框坐标值,
扫描二维码关注公众号,回复:
9489822 查看本文章
剩下的28个值为14个点,为相对于矩形框左上角得误差补偿即为与左上角坐标所形成的差值,形成封闭的弯曲文本框,
其计算方式可以简单的理解为:
1.将前4个坐标值的矩形框从原图中截取出来(左上右下4个点)
2.在截取之后的图中取14个点的坐标值