chinese-ocr
基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别
环境部署
sh setup.sh
使用环境: python 3.6 + tensorflow 1.10 + pytorch 0.4.1
- 注:CPU环境执行前需注释掉for gpu部分,并解开for cpu部分的注释
Demo
python demo.py
下载 预训练模型
CRNN
将pytorch-crnn.pth放入/train/models中
CTPN
将checkpoints.zip解压后的内容放入/ctpn/checkpoints中
模型训练
warp-ctc安装pytorch版
CTPN训练
CRNN训练
1.数据准备
下载训练集
- 共约364万张图片,按照99:1划分成训练集和验证集
- 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
- 包含汉字、英文字母、数字和标点共5990个字符
- 每个样本固定10个字符,字符随机截取自语料库中的句子
- 图片分辨率统一为280x32
修改/train/config.py中train_data_root
,validation_data_root
以及image_path
2.训练
cd train
python train.py
3.训练结果
效果展示
CTPN
OCR
参考
warp-ctc-pytorch
chinese_ocr-(tensorflow+keras)
CTPN-tensorflow
crnn-pytorch