Tesseract-OCR 入门使用 - 代码天地

Tesseract-OCR 入门使用

其他 2018-11-16 03:06:11 阅读次数: 0

版权声明：转载请说明来源，谢谢 https://blog.csdn.net/wsp_1138886114/article/details/84069855

文章目录

一、Tesseract-OCR 安装
二、测试

以下只针对widows平台，linux下没有测试

一、Tesseract-OCR 安装

Tesseract-OCR遵循Apache 2.0 license开源协议。
下载地址：https://digi.bib.uni-mannheim.de/tesseract/
你也可以查看源码编译安装：https://github.com/tesseract-ocr/tesseract/wiki/Downloads
或者非官方安装包：https://github.com/UB-Mannheim/tesseract/wiki

windows下安装一路next
在这里插入图片描述
这一步，我们需要选择添加语言 chinese simple
在进入安装目录，执行.\tesseract

二、测试

查看可用的 “语言” -–list-langs 执行：tesseract --list-langs
执行 tesseract D:\example_05.jpg D:\out 默认使用英文识别，输出out.txt
执行 tesseract D:\example_05.jpg D:\out -l eng 指定英文识别，输出out.txt
执行 tesseract D:\example_05.jpg D:\out -l eng pdf 使用英文识别，输出out.pdf
执行 tesseract --print-parameters 查看全部参数
使用 -c 选项来设定单项参数的值:
tesseract D:\example_05.jpg D:\out -l chi_sim -c language_model_ngram_on=1
使用多个 -c 选项来设置多个参数的值。
将多项参数设置写入文件，然后在识别时使用该文件:
tesseract paper.png paper -l chi_sim tess.conf

扫描二维码关注公众号，回复： 4090905 查看本文章
需要注意的是，如果配置文件有两个配置文件 tess_1.conf 和 tess_2.conf:
tesseract paper.png paper -l chi_sim tess_1.conf tess_2.conf
以上代码确实实现了输出：不过结果糟糕，可以试一下。

鸣谢
https://blog.csdn.net/haluoluo211/article/details/53304900

猜你喜欢

转载自blog.csdn.net/wsp_1138886114/article/details/84069855

Tesseract-OCR 入门

Tesseract-OCR的使用

Tesseract-OCR 入门使用

Tesseract-OCR引擎入门

Tesseract-OCR 的安装与使用

Tesseract-ocr 安装与使用

tesseract-ocr的安装及使用

使用jTessBoxEditorFX训练Tesseract-OCR教程

【方法】Tesseract-OCR使用心得

c++中使用Tesseract-OCR

Tesseract-OCR编译及ViewerDebugging使用

tesseract-ocr 使用java进行识别

Tesseract-OCR的简单使用与训练

windows下tesseract-ocr的安装及使用

tesseract-ocr 开源引擎使用

Tesseract-OCR命令及WPF简单使用

windows安装使用 tesseract-ocr

Python3.6使用tesseract-ocr的正确姿势

linux下python使用tesseract-ocr进行图片识别

使用tesseract-ocr破解网站验证码

使用Tesseract-OCR训练文字识别记录

使用 tesseract-ocr生成训练库全部指令

Tesseract-ocr视觉学习-验证码识别及使用

Python pyocr和Tesseract-OCR的安装以及使用

python使用tesseract-ocr完成验证码识别

Tesseract-OCR命令行使用

Windows 10使用Tesseract-OCR出现WindowsError: [Error 2]

使用tesseract-ocr实现图片文字识别 docker版

【opencv 学习】使用tesseract-ocr机芯数字识别

Mac下Tesseract-OCR文字识别新手使用入门

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)