• Stars
    star
    2,639
  • Rank 17,333 (Top 0.4 %)
  • Language
    Python
  • License
    Apache License 2.0
  • Created almost 4 years ago
  • Updated 4 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVION and PaddlePaddle. (将PaddleOCR模型做了转换,采用ONNXRuntime推理,速度很快)

简体中文 | English

捷智OCR

信创级开源OCR - 为世界内容安全贡献力量

Open in Colab
PyPI Documentation Status SemVer2.0

目录

商业支持

  • 🎉🎉🎉 推出知识星球RapidAI私享群,这里的提问会优先得到回答和支持,也会享受到RapidAI组织后续持续优质的服务,欢迎大家的加入。
  • 提供信创平台多架构,包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持,同时兼容ONNXRuntime/OpenVINO/NCNN。有意者邮件联系: [email protected], 请先邮件咨询服务项目,即时回复联系方式。
  • 提供国产操作系统(海光、中科方德、麒麟等等)OCR Docker部署服务,有意者 → [email protected]

简介

  • 💖目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
  • 支持的语言: 默认是中英文,其他语言识别需要自助转换。具体参考这里
  • 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用Python/C++/Java/Swift/C# 将它移植到各个平台。
  • 名称来源: 轻快好省并智能。基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。
  • 使用
    • 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
    • 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
  • 如果该仓库有帮助到你,还请点个小星星呗!

文档导航

生态框架

flowchart LR
    subgraph Step
    direction TB
    C(Text Det) --> D(Text Cls) --> E(Text Rec)
    end

    A[/OurSelf Dataset/] --> B(PaddleOCR) --Train--> Step --> F(PaddleOCRModelConverter)
    F --ONNX--> G{RapidOCR Deploy\n<b>Python/C++/Java/C#</b>}
    G --> H(Windows x86/x64) & I(Linux) & J(Android) & K(Web) & L(Raspberry Pi)

    click B "https://github.com/PaddlePaddle/PaddleOCR" _blank
    click F "https://github.com/RapidAI/PaddleOCRModelConverter" _blank

在线demo

  • 自建在线demo
    • 详情参见:ocrweb/README
    • demo所用模型组合(最优组合)为:
      ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
      
    • 示例图:
  • Hugging Face Demo
    • 该demo依托于Hugging Face的Spaces构建,采用Gradio库搭建。
    • 示例图:

更新日志(more)

TODO以及任务认领

  • 参见这里:link

原始发起者及初创作者

致谢

赞助

赞助者 应用的产品
-
  • 如果您想要赞助该项目,可直接点击当前页最上面的Sponsor按钮,请写好备注(您的Github账号名称),方便添加到上面赞助列表中。

版权声明

  • 如果你的产品使用了本仓库中的全部或部分代码、文字或材料
  • 如果你的研究用到了该项目,可以如下引用:
    @misc{RapidOCR 2021,
        title={{Rapid OCR}: OCR Toolbox},
        author={MindSpore Team},
        howpublished = {\url{https://github.com/RapidAI/RapidOCR}},
        year={2021}
    }

授权

  • OCR模型版权归百度所有,其它工程代码版权归本仓库所有者所有。
  • 本软件采用Apache 授权方式,欢迎大家贡献代码,提交issue 甚至PR。

加入我们

  • 微信扫描以下二维码,关注RapidAI公众号,回复OCR即可加入RapidOCR微信交流群:

  • 欢迎加入我们的QQ群下载模型及测试程序。1群:887298230 已满,2群:755960114 已满,3群:450338158

示例图

C++/JVM示例图像

.Net示例图像

多语言示例图像

More Repositories

1

RapidASR

商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.
C++
483
star
2

RapidLaTeXOCR

Formula recognition based on LaTeX-OCR and ONNXRuntime.
Python
266
star
3

LabelConvert

🔄 A tool for object detection and image segmentation dataset format conversion.
Python
266
star
4

Knowledge-QA-LLM

QA based on local knowledge and LLM.
Python
189
star
5

RapidStructure

版面分析 | 表格识别 | 文档方向分类
Python
177
star
6

RapidOcrOnnx

rapidocr onnx cpp
C++
146
star
7

TableStructureRec

整理目前开源的表格识别模型,完善前后处理,模型转换为ONNX
Python
130
star
8

RapidOCRPDF

Based on RapidOCR, extract the PDF content.
Python
119
star
9

RapidLayout

Analysis of Chinese and English layouts 中英文版面分析
Python
81
star
10

RapidOcrAndroidOnnx

C++
53
star
11

RapidOcrNcnn

RapidOCR ncnn 推理
C++
50
star
12

PaddleOCRModelConvert

Convert the model in PaddleOCR to ONNX format
Python
45
star
13

LLM-EXAM

大模型中文测试题库-民间版本
45
star
14

RapidTTS

A cross platform implementation of Text-to-Speech based on ONNXRuntime.
Python
32
star
15

OnnxruntimeBuilder

Onnxruntime Builder
Shell
31
star
16

RapidOCRCSharp

C#
28
star
17

OpenCVBuilder

OpenCV Custom Builder
Shell
22
star
18

Paddle2OnnxConvertor

Convert paddle model to onnx model
Python
20
star
19

RapidPunc

A library for adding punctuation into a text from ASR.
C++
17
star
20

RapidOcrAndroidOnnxCompose

opencv onnxruntime ocr android demo, jetpack compose + kotlin
Kotlin
13
star
21

RapidVoice

The engineering implementation of SenseVoice (from Alibaba)
8
star
22

RapidTable

源自PP-Structure的表格识别算法,模型转换为ONNX,推理引擎采用ONNXRuntime,部署简单,无内存泄露问题。
Python
8
star
23

RapidOcrOnnxJvm

RapidOcr onnx java kotlin jni test
Kotlin
7
star
24

RapidOcrAndroidNcnn

C++
6
star
25

RapidLayoutRecover

针对文档类图像,整合版面分析、文字识别、表格识别和公式识别结果,还原版面布局信息。
Python
5
star
26

keyframe_extractor

To extract key frames from a video.
Python
5
star
27

paraformer_simple

Python
4
star
28

LLM-DOC

大模型研究院资料馆
4
star
29

RapidOcrNcnnJvm

RapidOcr ncnn java kotlin jni
Kotlin
4
star
30

RapidAudioKit

It's for the repository of audio resampling tools
C
3
star
31

RapidImgUtil

Image processing library to add some new formats and other supports.
C++
2
star
32

RapidOcrNcnnLibTest

rapid ocr ncnn lib test
CMake
2
star
33

RapidOCRDocs

RapidOCR Document
HTML
2
star
34

VoiceCut

1
star
35

paddleocr2ncnn

Batchfile
1
star
36

RapidAIWebSite

HTML
1
star
37

RapidOcrOnnxLibTest

rapidocr onnx cpp lib test
CMake
1
star
38

RapidPix2Pix

Inference code based on the onnxruntime about pix2pix
Python
1
star