AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端

Posted 2022年10月11日 2022-10-11T08:40:28+08:00 by Bingal

Updated 2022年11月18日 2022-11-18T21:24:55+08:00

1. 缘起

最近在学习研究AI相关的技术，发现百度 Paddle 框架简单易用，PaddleOCR 在文字识别方面表现出色，但是对于非程序员来说，使用 PaddleOCR 还是有一定门槛，所以就尝试用把 PaddleOCR 做成一个更简单易用的桌面客户端。目前已支持批量添加图片、拖动图片到软件界面、粘贴剪贴板的图片进行识别。

开发这个项目的另一个目的是想尝试一种将 python 项目打包成桌面客户端的方式，也考虑过直接使用 python 的 GUI 方案，但是还是想尝试一下基于 web 做 ui 的方案，所以就使用了 electron 开发界面。界面与 python 交互使用了 thrift 方案，相比 http 更适合本地通信。

2. 项目简介

AI-OCR 是基于 PaddleOCR 的OCR桌面客户端程序，支持Windows、Linux、MacOS等操作系统。
技术架构
- 前端界面：Electron + Reactjs + ArcoDesign
- OCR引擎：PaddleOCR + Pyinstaller 打包成独立服务
- 前端和OCR引擎通信：thrift (跨语言RPC通信框架)

3. 软件界面

软件界面

7. 未来可能的优化方向

打包的时候排除不必要的库，减小打包体积
OCR推理引擎改用C++实现，提高推理速度和大幅减小打包体积
优化前端界面，增加更多功能，比如：增加多种语言模型，增加表格识别导出excel等

如果本软件对你您有用，请多多支持，这将使我有更有动力不断完善，谢谢！

捐赠收款码

真诚邀请您走进我的知识小宇宙，关注我个人的公众号，在这里，我将不时为您献上独家原创且极具价值的技术内容分享。每一次推送，都倾注了我对技术领域的独特见解与实战心得，旨在与您共享成长过程中的每一份收获和感悟。您的关注和支持，是我持续提供优质内容的最大动力，让我们在学习的道路上并肩同行，共同进步，一起书写精彩的成长篇章!

This post is licensed under CC BY 4.0 by the author.

AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端

1. 缘起

2. 项目简介

3. 软件界面

4. 编译和打包说明（mac和windows）

5. 软件下载（mac和windows）

6. 项目源码

7. 未来可能的优化方向

如果本软件对你您有用，请多多支持，这将使我有更有动力不断完善，谢谢！

Further Reading

国内下载大模型的极速通道：替代 Huggingface 的优选方案

通义千问 Qwen-VL-Chat 本地部署: 破解滑块验证码和给图片提取关键词

运用AI技术，我如何在两分钟内创作出《程序员之歌》【Suno创作过程】

Trending Tags