tesseract图片识别库的简单操作

https://github.com/tesseract-ocr/    github按照教程下载
解压到D\E盘下                        一直next安装,选择安装到  E:\tesseract\Tesseract-OCR
设置系统路径               变量名|TESSDATA_PREFIX      值(value)|E:\tesseract\Tesseract-OCR\tessdata
设置tesseract命令路径                在系统环境变量(Path)中添加E:\tesseract\Tesseract-OCR
cmd切换到存放图片路径,识别带有英文(默认支持)的图片,tesseract 1.png a
这条命令的意思是:找到1.png图片并把识别的数据存放到a.txt文件中
下载培训中文数据:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files    (chi_sim)
查看所有命令 tesseract -h
查看所有培训语言数据 tesseract --list-langs
识别带有中文的图片:tesseract 2.png b -l chi_sim
这条命令的意思是:找到2.png图片并用中文识别之后把数据存放到b.txt

猜你喜欢

转载自www.cnblogs.com/Guishuzhe/p/9858111.html