AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端

Posted 2022年10月11日 2022-10-11T08:40:28+08:00 by Bingal

Updated 2022年11月18日 2022-11-18T21:24:55+08:00

1. 缘起

最近在学习研究AI相关的技术，发现百度 Paddle 框架简单易用，PaddleOCR 在文字识别方面表现出色，但是对于非程序员来说，使用 PaddleOCR 还是有一定门槛，所以就尝试用把 PaddleOCR 做成一个更简单易用的桌面客户端。目前已支持批量添加图片、拖动图片到软件界面、粘贴剪贴板的图片进行识别。

开发这个项目的另一个目的是想尝试一种将 python 项目打包成桌面客户端的方式，也考虑过直接使用 python 的 GUI 方案，但是还是想尝试一下基于 web 做 ui 的方案，所以就使用了 electron 开发界面。界面与 python 交互使用了 thrift 方案，相比 http 更适合本地通信。

2. 项目简介

AI-OCR 是基于 PaddleOCR 的OCR桌面客户端程序，支持Windows、Linux、MacOS等操作系统。
技术架构
- 前端界面：Electron + Reactjs + ArcoDesign
- OCR引擎：PaddleOCR + Pyinstaller 打包成独立服务
- 前端和OCR引擎通信：thrift (跨语言RPC通信框架)

3. 软件界面

软件界面

7. 未来可能的优化方向

打包的时候排除不必要的库，减小打包体积
OCR推理引擎改用C++实现，提高推理速度和大幅减小打包体积
优化前端界面，增加更多功能，比如：增加多种语言模型，增加表格识别导出excel等

如果本软件对你您有用，请多多支持，这将使我有更有动力不断完善，谢谢！

捐赠收款码

真诚邀请您走进我的知识小宇宙，关注我个人的公众号，在这里，我将不时为您献上独家原创且极具价值的技术内容分享。每一次推送，都倾注了我对技术领域的独特见解与实战心得，旨在与您共享成长过程中的每一份收获和感悟。您的关注和支持，是我持续提供优质内容的最大动力，让我们在学习的道路上并肩同行，共同进步，一起书写精彩的成长篇章!

This post is licensed under CC BY 4.0 by the author.

AI-OCR 基于PaddleOCR的跨平台OCR桌面客户端

1. 缘起

2. 项目简介

3. 软件界面

4. 编译和打包说明（mac和windows）

5. 软件下载（mac和windows）

6. 项目源码

7. 未来可能的优化方向

如果本软件对你您有用，请多多支持，这将使我有更有动力不断完善，谢谢！

Further Reading

Claude Code 实战指南：从入门到精通

Claude Agent SDK 完整指南：从零开始构建 AI Agent

如何使用 Claude Code 开始每一个项目

Trending Tags