简体中文 | English
捷智OCR
信创级开源OCR - 为世界内容安全贡献力量
目录
商业支持
🎉 🎉 🎉 推出知识星球RapidAI私享群,这里的提问会优先得到回答和支持,也会享受到RapidAI组织后续持续优质的服务,欢迎大家的加入。- 提供信创平台多架构,包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持,同时兼容ONNXRuntime/OpenVINO/NCNN。有意者邮件联系: [email protected], 请先邮件咨询服务项目,即时回复联系方式。
- 提供国产操作系统(海光、中科方德、麒麟等等)OCR Docker部署服务,有意者 →
✉ [email protected]。
简介
💖 目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。- 支持的语言: 默认是中英文,其他语言识别需要自助转换。具体参考这里
- 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用
Python/C++/Java/Swift/C#
将它移植到各个平台。 - 名称来源: 轻快好省并智能。基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。
- 使用:
- 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
- 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
- 如果该仓库有帮助到你,还请点个小星星
⭐ 呗!
文档导航
- Wiki
- Python范例
- C++范例(Windows/Linux/macOS)
- Jvm范例(Java/Kotlin)
- .Net范例(C#)
- Android范例
- 网页版范例
- API版
- 版面结构化-RapidStructure
- 衍生项目
- 垂直项目
- RapidOCRPDF:解析PDF文件
- RapidVideOCR:基于RapidOCR,提取视频中的硬字幕
- LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
- PaperEdge:文档图像矫正 | Demo
- CTRNet:图像文字擦除 | Demo
- 模型相关
- 常见问题 FAQ
生态框架
flowchart LR
subgraph Step
direction TB
C(Text Det) --> D(Text Cls) --> E(Text Rec)
end
A[/OurSelf Dataset/] --> B(PaddleOCR) --Train--> Step --> F(PaddleOCRModelConverter)
F --ONNX--> G{RapidOCR Deploy\n<b>Python/C++/Java/C#</b>}
G --> H(Windows x86/x64) & I(Linux) & J(Android) & K(Web) & L(Raspberry Pi)
click B "https://github.com/PaddlePaddle/PaddleOCR" _blank
click F "https://github.com/RapidAI/PaddleOCRModelConverter" _blank
在线demo
- 自建在线demo
- 详情参见:ocrweb/README
- demo所用模型组合(最优组合)为:
ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
- 示例图:
- Hugging Face Demo
- 该demo依托于Hugging Face的Spaces构建,采用Gradio库搭建。
- 示例图:
more)
更新日志(TODO以及任务认领
- 参见这里:link
原始发起者及初创作者
致谢
- 非常感谢DeliciaLaniD修复ocrweb中扫描动画起始位置错位问题。
- 非常感谢zhsunlight关于参数化调用GPU推理的建议以及细致周到的测试。
- 非常感谢lzh111222334修复python版本下rec前处理部分bug。
- 非常感谢AutumnSun1996在#42中的建议。
- 非常感谢DeadWood8提供了Nuitka打包rapidocr_web的操作文档和可执行exe。
- 非常感谢Loovelj指出对文本检测框排序时顺序问题,详情参见issue 75。
赞助
赞助者 | 应用的产品 |
---|---|
- |
- 如果您想要赞助该项目,可直接点击当前页最上面的Sponsor按钮,请写好备注(您的Github账号名称),方便添加到上面赞助列表中。
版权声明
- 如果你的产品使用了本仓库中的全部或部分代码、文字或材料
- 如果你的研究用到了该项目,可以如下引用:
@misc{RapidOCR 2021, title={{Rapid OCR}: OCR Toolbox}, author={MindSpore Team}, howpublished = {\url{https://github.com/RapidAI/RapidOCR}}, year={2021} }
授权
- OCR模型版权归百度所有,其它工程代码版权归本仓库所有者所有。
- 本软件采用Apache 授权方式,欢迎大家贡献代码,提交issue 甚至PR。
加入我们
-
微信扫描以下二维码,关注RapidAI公众号,回复OCR即可加入RapidOCR微信交流群:
-
欢迎加入我们的QQ群下载模型及测试程序。1群:
887298230已满,2群:755960114已满,3群:450338158