首页技术文章正文

tesseract安装和环境变量配置教程

更新时间:2021-06-25 来源:黑马程序员 浏览量:

Tesseract是一个开源的OCR库,是目前公认的最优秀、最精确的开源OCR系统,具有精准度高、灵活性高等特点。它不仅可以通过训练识别出任何字体(只要字体的风格保持不变即可),而且可以识别出任何Unicode字符。

Tesseract支持60种以上的语言,它提供了一个引擎和命令行工具。要想在Windows系统下使用Tesseract,需要先安装Tesseract-OCR引擎,可以从网址https://github.com/UB-Mannheim/tesseract/wiki 进行下载,如下图所示。

Tesseract下载教程

该网址提供的下载版本为V5.0.0,下载完成后,双击安装文件,按照默认设置进行安装。 默认情况下,安装文件会为其配置系统环境变量,以指向安装目录。这样,就可以在任意目录下使用tesseract命令运行。如果没有配置环境变量,可以手动进行设置,默认安装目录为:

C:\Program Files\Tesseract-OCR

tesseract环境变量配置

打开命令行窗口,输人tesseract命令进行验证。如果安装成功,则会输出如下图所示的信息。

tesseract环境变量配置成功

分享到:
在线咨询 我要报名
和我们在线交谈!