PaddleOCR方向分类器优化输入图像

方向分类器对于过长或者过短的分类效果可能不好。
例如过长的情况:
在这里插入图片描述
在这里插入图片描述

虽然能分对,但是置信度分别是[‘0’, 0.8890628]和[‘180’, 0.97985005]。

过短的文本如一个字符:
在这里插入图片描述
在这里插入图片描述
分类的情况分别是[‘0’, 0.84042734]和[‘180’, 0.9551178]。

我们在测试大量图片时,有些过长的文本出现了明显的错误,因此我对图像进行了处理:
如果是过长的文本则进行截断,过短的文本则复制扩展成输入图像的尺寸。

修改后过长文本测试效果:[‘0’, 1.0]和[‘180’, 1.0]。
过短文本:[‘0’, 0.9987532]和[‘180’, 0.99973863]。可以明显看出有明显提升。

修改前 修改后
过长-正向 0.88 1.0
过长-反向 0.97 1.0
过短-正向 0.84 0.99
过短-反向 0.95 0.99

猜你喜欢

转载自blog.csdn.net/sdlypyzq/article/details/108869571