14.6K star!最好用的OCR文字识别项目,没有之一!

* 戳上方蓝字“开源先锋”关注我


大家好,我是开源君!

伙伴们,平时都会用到文字识别吧?

最近,开源君在Github上发现了一个厉害的开源OCR项目——Umi-OCR,真的很强大,而且还可以离线使用,现在已经有了14.6k+的星标。

简介

下面是项目在Github上的官方介绍。

14.6K star!最好用的OCR文字识别项目,没有之一!

项目是基于PaddleOCR开发的,支持截图识别、批量导入识别、个性化识别等功能。

整个项目都是用Python编写的,所以win7系统的朋友们可能用不了。推荐使用Win10 x64及以上版本。

体验

直接在releases中选择合适的版本,下载解压即可。

下面就是工具的界面。

14.6K star!最好用的OCR文字识别项目,没有之一!

接下来给大家展示一下它的亮点功能:

截图识别

14.6K star!最好用的OCR文字识别项目,没有之一!

这个功能很适合在一些不能复制的网页上使用,速度很快,准确率也很高。

也就是说,你可以一次性截取所有的图片,然后再从记录板里复制所有识别出来的文字,不需要一张一张地截取和复制。

14.6K star!最好用的OCR文字识别项目,没有之一!

批量识别

14.6K star!最好用的OCR文字识别项目,没有之一!

如果有很多图片需要识别,这个功能非常好用。

只需要将所有的图片导入,然后点击开始任务,就可以批量识别了。

完成之后,识别的内容会保存在一个txt文档中。

14.6K star!最好用的OCR文字识别项目,没有之一!

如果你不喜欢txt,需要md、jsonl 的格式,它一样可以满足你。

14.6K star!最好用的OCR文字识别项目,没有之一!

自定义识别内容

这个功能是Umi-OCR的一大亮点,可以指定识别的内容区域,或者屏蔽掉不需要识别的区域。

比如说,我有三张和下图类似的图片,我只希望提取出发票号码。

14.6K star!最好用的OCR文字识别项目,没有之一!

只需要在设置里点击打开忽略区域编辑器,将不需要的内容用红框框起来。14.6K star!最好用的OCR文字识别项目,没有之一!

14.6K star!最好用的OCR文字识别项目,没有之一!

然后点击开始任务即可。

14.6K star!最好用的OCR文字识别项目,没有之一!

更多细节功能,可以自行去项目地址探索~

GitHub地址:https://github.com/hiroi-sora/Umi-OCR


原文始发于微信公众号(开源先锋):14.6K star!最好用的OCR文字识别项目,没有之一!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/200578.html

(0)
小半的头像小半

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!