开源OCR识别工具包,自带多个识别模型

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个Python3下的文字识别(Optical Character Recognition,简称OCR)工具包——cnocr。

开源OCR识别工具包,自带多个识别模型

cnocr 主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。

安装

pip install cnocr

安装速度慢的话,可以指定国内的安装源,比如使用豆瓣源:

pip install cnocr -i https://pypi.doubanio.com/simple

使用方法

针对多行文字的图片识别

如果待识别的图片包含多行文字,或者可能包含多行文字(如下图),可以使用 CnOcr.ocr() 进行识别。

开源OCR识别工具包,自带多个识别模型

from cnocr import CnOcr

ocr = CnOcr()
res = ocr.ocr('docs/examples/multi-line_cn1.png')
print("Predicted Chars:", res)

或者

from cnocr.utils import read_img
from cnocr import CnOcr

ocr = CnOcr()
img_fp = 'docs/examples/multi-line_cn1.png'
img = read_img(img_fp)
res = ocr.ocr(img)
print("Predicted Chars:", res)

针对单行文字的图片识别

如果明确知道待识别的图片包含单行文字(如下图),可以使用 CnOcr.ocr_for_single_line() 进行识别。

开源OCR识别工具包,自带多个识别模型

from cnocr import CnOcr

ocr = CnOcr()
res = ocr.ocr('docs/examples/multi-line_cn1.png')
print("Predicted Chars:", res)

或者

from cnocr.utils import read_img
from cnocr import CnOcr

ocr = CnOcr()
img_fp = 'docs/examples/multi-line_cn1.png'
img = read_img(img_fp)
res = ocr.ocr(img)
print("Predicted Chars:", res)

效果示例

开源OCR识别工具包,自带多个识别模型


-END-

开源协议:Apache2.0

开源地址:https://gitee.com/cyahua/cnocr

原文始发于微信公众号(开源技术专栏):开源OCR识别工具包,自带多个识别模型

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/66065.html

(0)
小半的头像小半

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!