• Stars
    star
    1,345
  • Rank 34,927 (Top 0.7 %)
  • Language
    Python
  • Created over 4 years ago
  • Updated about 1 year ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法

PytorchOCR

简介

PytorchOCR旨在打造一套训练,推理,部署一体的OCR引擎库

添加微信z572459439或者nsnovio,然后进群讨论。备注ocr进群。

更新日志

  • 2022.02.24 更新:新增convnext作为backbone
  • 2022.01.28 更新:新增transformer作为backbone
  • 2022.01.07 更新:
  1. 检测模型新增backbone类型ghostnet
  2. 新增pse模型
  3. 新增dbnet的蒸馏版本
  4. 新增新版轻量化检测模型
  5. 修复一些bug
  • 2021.02.27 添加移动端识别模型文件、移动端DBNet模型文件
  • 2021.02.25 添加服务器端识别模型文件
  • 2021.02.09 添加DBNet模型,修改DBNet网络结构的fpn,inference时候的缩放及后处理
  • 2020.07.01 添加 添加新算法文档
  • 2020.06.29 添加检测的mb3和resnet50_vd预训练模型
  • 2020.06.25 检测模块的训练和预测ok
  • 2020.06.18 更新README
  • 2020.06.17 识别模块的训练和预测ok

todo list

  • crnn训练与python版预测
  • DB训练与python版预测
  • imagenet预训练模型
  • 服务器端识别模型文件
  • DB通用模型
  • 手机端部署
  • With Triton,推荐使用Savior

环境配置

需要的环境如下

  • pytorch 1.4+
  • torchvision 0.5+
  • gcc 4.9+ (pse,pan会用到)

快速安装环境

pip3 install -r requirements.txt

文档教程

文本检测算法

PytorchOCR开源的文本检测算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
预训练模型 ResNet50 服务器端 97.3M 3cmz
原始超轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M c9ko
新版 轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M 39ne
通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 ResNet18 服务器端 47.2M r26k
预训练模型 swin_transformer 服务器端 240M se32
预训练模型 convnext 服务器端 113M 46is

文本识别算法

PytorchOCR开源的文本识别算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
原始超轻量模型,支持中英文、数字识别 MoblieNet 移动端 4.2M 7x9q
通用模型,支持中英文、数字识别 ResNet34 服务器端 106.4M sdnc

预训练模型下载地址

链接: https://pan.baidu.com/s/1uMWys5lQ5ZfhnaOCPBVqZw 密码: i9du

结果展示

检测

检测

贡献代码

我们非常欢迎你为PytorchOCR贡献代码,也十分感谢你的反馈。

相关仓库

More Repositories

1

DBNet.pytorch

A pytorch re-implementation of Real-time Scene Text Detection with Differentiable Binarization
Python
939
star
2

OCR_DataSet

收集并整理有关OCR的数据集并统一标注格式,以便实验需要
Python
856
star
3

PSENet.pytorch

A pytorch re-implementation of PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network
C++
462
star
4

PAN.pytorch

A unofficial pytorch implementation of PAN(PSENet2): Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
C++
413
star
5

TableGeneration

通过浏览器渲染生成表格图像
Python
185
star
6

flask_pytorch

using flask to run pytorch model
Python
48
star
7

crnn.gluon

A gluon re-implementation of Convolutional recurrent network in gluon
Python
21
star
8

reprod_log

Python
16
star
9

Segmentation-Free_OCR

recognize chinese and english without segmentation
Python
11
star
10

Torch_Quant_Demo

一个使用torch进行量化训练的demo
Python
9
star
11

ctpn.pytorch

Python
9
star
12

crypto

Python
7
star
13

dl_docker

用于深度学习的docker环境,cuda支持cuda10.1和cuda10.2,框架支持各种框架
Dockerfile
6
star
14

IcdarToCOCO

Python
5
star
15

gluon_mnist

learning gluon with mnist dataset
Python
5
star
16

mxnet_cifar10

Python
4
star
17

crnn.paddle

Python
4
star
18

leetcode

learning data struct with python
Jupyter Notebook
4
star
19

UCDIR.paddle

Python
4
star
20

TableMASTER_mmocr

Python
3
star
21

rust_python

use rust speed up python
Rust
3
star
22

pytorch_mnist

learning pytorch with mnist dataset
Python
3
star
23

WenmuZhou.github.io

个人博客
HTML
2
star
24

keras_mnist

learning keras with mnist
Python
2
star
25

gitment-comments

2
star
26

DABNet_Paddle

a paddle reproduce of DABNet
Python
1
star
27

simple_nlp

Python
1
star