Windows下 tesseract 的配置
总感觉tesseract配起来无比蛋疼。。写个博文舒缓下心情
先留个坑,给安装tesseract-ocr
pytesseract的安装
一、install pip pytesseract
你懂的。。
二、更改 pytesseract.py 中的 tesseract.exe 的路径
三、配置中文OCR
在chi_sim.traineddata的目录下新建文件 chi_sim.config
在chi_sim.traineddata的目录下打开命令行,输入
combine_tessdata -e chi_sim.traineddata chi_sim.config
- 打开chi_sim.config,在allow_blob_division F这一行前面加#注释掉
…
中文OCR还没配成功,先这样吧
四、 测试代码
import pytesseract
from PIL import Image
image = Image.open('en1.png')
text = pytesseract.image_to_string(image)
print(text)