Tesseract5.0 图像识别本地服务 一 【安装配置】

不管现实多么惨不忍睹,都要持之以恒地相信,这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去,不要担心此刻的付出没有回报,别再花时间等待天降好运。真诚做人,努力做事!你想要的,岁月都会给你。Tesseract5.0 图像识别本地服务 一 【安装配置】,希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com,来源:原文

一:简介

OCR(Optical Character Recognition):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后由Google进行改进、修改bug、优化,重新发布。

二:下载

1、Windows版本Tesseract各版本下载,本教程用的版本是tesseract-ocr-w64-setup-v5.0.0.20190623(【注意】要3.0以上才支持中文)。
项目github地址:Tesseract

2、各版本对应字库要识别简体中文需要下载chi_sim.traindata字库(【注意】根据版本下载对应字库)。

3、jTessBoxEditor官网下载,用来训练字库的,带FX的版本才支持中文。

4、各位打不开链接的朋友,看这里:

链接:https://pan.baidu.com/s/1ViyFSR9CjXVy8b7mQeTISQ 
提取码:m87b 

 三:安装

这个就不截图了

Tesseract5.0 图像识别本地服务 一 【安装配置】

安装完成后我们配置环境变量

四:配置环境变量

1、配置系统环境变量

tesseract-ocr-Home

C:\Program Files\Tesseract-OCR

Tesseract5.0 图像识别本地服务 一 【安装配置】

path : 加上新配置的信息

;%tesseract-ocr-Home%

Tesseract5.0 图像识别本地服务 一 【安装配置】

2、配置字库-后期JAVA API要使用

TESSDATA_PREFIX

C:\Program Files\Tesseract-OCR\tessdata

Tesseract5.0 图像识别本地服务 一 【安装配置】

备注:将下载好的字库放到Tesseract-OCR项目的tessdata文件夹里面。 

五:验证安装的效果

在cmd窗口输入tesseract -v,配置成功如下图:

Tesseract5.0 图像识别本地服务 一 【安装配置】

 

六:识别-看看识别的效果 

 

1、tesseract 图片名称 生成的结果文件的名称 字库

 例如我的图片识别就是:

tesseract test.png result -l eng

 1、执行命令:

Tesseract5.0 图像识别本地服务 一 【安装配置】

2、原图片:

Tesseract5.0 图像识别本地服务 一 【安装配置】

3、识别结果:

Tesseract5.0 图像识别本地服务 一 【安装配置】

这一期就先这样了

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/160844.html

(0)
飞熊的头像飞熊bm

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!