pytesseract图像文字识别

利用python的包进行图像文字识别:

pytesseract的安装教程：https://blog.csdn.net/qq_36535820/article/details/103426054

导入pytesseract包

>>> import pytesseract
>>> from PIL import Image

图像文字识别结果:

待识别图像：

图像11：

图像文字识别代码及结果：

>>> im11 = Image.open(r'E:\\公司文件\\11.png')
>>> print(pytesseract.image_to_string(im11))
> What a me day :1 Is
> Its a Lovely Day Today
> Today's weather
> Today Is nne

图像12：

图像文字识别代码及结果：

>>> im12 = Image.open(r'E:\\公司文件\\12.png')
>>> print(pytesseract.image_to_string(im12))
ABCDEFG
HI JKLMN
OPQRSTU
VWXYZ

图像13：

>>> im13 = Image.open(r'E:\\公司文件\\13.png')
>>> print(pytesseract.image_to_string(im13))

图像14：

图像文字识别代码及结果：

>>> im14 = Image.open(r'E:\\公司文件\\14.png')
>>> print(pytesseract.image_to_string(im14))
JA,.,.,..»./wmwaxwu,
mu zémééaa/f.u~ru».4:t xx. wdganu/ruh. ,»6wK«
Iwyaé wiﬂ m uni.»//nag»/-2‘: den}

/7 Mr’? he/-yd/¢. .,., 4... /M 1.1-/./Viym
vnu .4! W rrnww-ma, 4»; Am.» ﬂu. ﬂan.
tm._JA A A,/. 9/Am/yﬂé. jM4n’¢r1fAll:
arfvazH:ﬁu»«¢d/m mud,  My/56¢
u-./ aw¢Auy.yyuam.mAfm,.., wy vngzmi
mm/aimzzsﬂum .4u(../.»«m,...;H: '
Ia-1;‘ mg; on. .2 aé:mz.Z7mm¢<,/w ea-rm". -1:43./:5-r
war m a mg, 41., «M».

50-‘ 47.57/24. J3.»»..§_{:m.‘i'/1 2.»;

: uyx  %Vdz ﬂ ..d.m, yfmm
vmwﬁ'H4£u.fM22w/ K/F07.‘Dtu Am 4,,,,g“,_
/I/71$]! Aim] 3*./11 {A44 /....4 Mia rs /u¥ m,

DWI‘-W012-gﬁl mm;

图像15：

图像文字识别代码及结果：

>>> im15 = Image.open(r'E:\\公司文件\\15.png')
>>> print(pytesseract.image_to_string(im15))
try V"J’L\/J ')v\ H

H4y/ o

1 eight
2 nine
» 3 ten
’ I . eleven
7 twelve
I ; thirteen

'  fourteen





10
11
12
13
14

8

ﬁfteen
sixteen
seventeen
eighteen
nineteen
twsnw

M twenty-(Mme

T,
15 ts

16 t]
17 f<
18 f

7195

205
216

折腾了好久，仍然只是在cmd上面测试成功，且图像文字识别效果不是很好。针对书写的清晰英文识别率较高，对不清晰、潦草或位置摆放不恰当的图片英文文字内容识别率差差。还没测试图像中文识别效果，估计也不会太好。

当然这些图片未经过任何处理，在经过一定处理后的图片，图像识别率会提升，但提升多少还未有测试。我看博客有个博主推荐了一片大神写的代码实现图像处理，提高pytesseract图像文字识别率，大家可以去看看（我没实践过，不知道代码实际效果了）。

*MuYu*

发布了147 篇原创文章 · 获赞 24 · 访问量 2万+

私信关注

pytesseract图像文字识别

利用python的包进行图像文字识别:

导入pytesseract包

图像文字识别结果:

猜你喜欢