• Stars
    star
    1,078
  • Rank 42,909 (Top 0.9 %)
  • Language
    Python
  • Created almost 7 years ago
  • Updated over 5 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

An awesome OCR engine developed by SYSU DeepDriving Lab

CPS-OCR-Engine

An awesome OCR engine developed by SYSU DeepDriving Lab

一个基于深度学习的文字识别系统,支持3755个(一级字库)的印刷体汉字识别。

因为近期在帮学校财务处审计处设计智能票据识别系统(已经支持数十类票据啦),需要用到OCR去识别一些汉字,做智能信息录入。对于汉字的识别,我尝试过Tessercact,实在太烂, 也试过百度的ocr接口,但是感觉不太适合(第一是要钱的,第二毕竟是别人的API,想优化也优化不了),那就自己搞一搞基于深度学习的OCR引擎吧,算是锻炼一下自己。

这个OCR模型专注于电子文档、证件、票据的汉字识别。

*** top 1 accuracy 0.99826 top 5 accuracy 0.99989 ***

数据合成

python gen_printed_char.py --out_dir ./dataset --font_dir ./chinese_fonts --width 30 --height 30 --margin 4 --rotate 30 --rotate_step 1

合成效果

图片说明

训练

python Chinese_OCR.py --mode=train --max_steps=16002 --eval_steps=100 --save_steps=500

模型评估

python Chinese_OCR.py --mode=validation

线上预测

要识别的图像往tmp目录下扔就行了。

 python Chinese_OCR.py --mode=inference 

效果

图片说明 图片说明

我从某篇论文中截图一小段文字,并做了单字切割,送入模型进行OCR预测。

图片说明 图片说明

识别结果全部正确!

图片说明

更多细节请访问我的博客:http://www.cnblogs.com/skyfsm/p/8443107.html

最后分享一下我的模型:链接:https://pan.baidu.com/s/1eTmm0eQ 密码:m7ns