Posts AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端
Post
Cancel

AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端

1. 缘起

最近在学习研究AI相关的技术,发现百度 Paddle 框架简单易用,PaddleOCR 在文字识别方面表现出色,但是对于非程序员来说,使用 PaddleOCR 还是有一定门槛,所以就尝试用把 PaddleOCR 做成一个更简单易用的桌面客户端。目前已支持批量添加图片、拖动图片到软件界面、粘贴剪贴板的图片进行识别。

开发这个项目的另一个目的是想尝试一种将 python 项目打包成桌面客户端的方式,也考虑过直接使用 python 的 GUI 方案,但是还是想尝试一下基于 web 做 ui 的方案,所以就使用了 electron 开发界面。界面与 python 交互使用了 thrift 方案,相比 http 更适合本地通信。

2. 项目简介

  • AI-OCR 是基于 PaddleOCR 的OCR桌面客户端程序,支持Windows、Linux、MacOS等操作系统。
  • 技术架构
    • 前端界面:Electron + Reactjs + ArcoDesign
    • OCR引擎:PaddleOCR + Pyinstaller 打包成独立服务
    • 前端和OCR引擎通信:thrift (跨语言RPC通信框架)

3. 软件界面

软件界面

4. 编译和打包说明(mac和windows)

AI-OCR编译和打包过程(mac版)

AI-OCR编译和打包过程(mwindows版)

5. 软件下载(mac和windows)

链接:https://pan.baidu.com/s/1TPOs2qVnY9fpkfEGZnA10Q?pwd=nfxu 提取码:nfxu

6. 项目源码

gitee: https://gitee.com/bingal/ai-ocr

github: https://github.com/bingal/ai-ocr

7. 未来可能的优化方向

  • 打包的时候排除不必要的库,减小打包体积
  • OCR推理引擎改用C++实现,提高推理速度和大幅减小打包体积
  • 优化前端界面,增加更多功能,比如:增加多种语言模型,增加表格识别导出excel等

如果本软件对你您有用,请多多支持,这将使我有更有动力不断完善,谢谢!

捐赠收款码


真诚邀请您走进我的知识小宇宙,关注我个人的公众号,在这里,我将不时为您献上独家原创且极具价值的技术内容分享。每一次推送,都倾注了我对技术领域的独特见解与实战心得,旨在与您共享成长过程中的每一份收获和感悟。您的关注和支持,是我持续提供优质内容的最大动力,让我们在学习的道路上并肩同行,共同进步,一起书写精彩的成长篇章!

AI文字转语音
AI个性头像生成
This post is licensed under CC BY 4.0 by the author.

Mac 版 Sourcetree 记录一次因修改git登录名引发的问题

复制朋友圈内容进行修改出现顺序错乱的现象是怎么回事?

Trending Tags