• Stars
    star
    309
  • Rank 135,306 (Top 3 %)
  • Language
  • Created over 1 year ago
  • Updated over 1 year ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

image datasets & model for text/book super-resolution

README

书之溯源 SourceBook

把低分辨率的扫描书恢复为高分辨率,是我多年夙愿。在了解到有超分辨率这一技术的时候,我就寄期望于能够用超分技术达成目的。

时间一天天过去,最后还是自己不完美地做了实现。

书之溯源即恢复书本身的模样,亦是书之夙愿的谐音;SourceBook中的Source是追溯的意思,也指代数据集中的一部分图片使用思源字体(Source Han)。

logo

关于数据集

训练使用的数据集包含多个部分的内容:

类型 文件前缀 来源 备注 链接
纯文本 sourcehan2 使用思源宋体合成纯文本图片,包含常见中英文字符及假名 v1黑白,v2灰阶 https://github.com/adobe-fonts/source-han-serif
纯文本 sourcehan 使用思源宋体合成纯文本图片,包含千字文及假名 灰阶 https://github.com/adobe-fonts/source-han-serif
纯文本 sourcehan1 使用思源黑体合成纯文本图片,包含千字文及假名 灰阶 https://github.com/adobe-fonts/source-han-sans
纯文本 sourcehan_b 使用思源黑体合成纯文本图片,包含千字文及假名,缩小字号并使用jpeg 60%压缩 彩色 https://github.com/adobe-fonts/source-han-sans
纯文本 wenkai 使用蒹葭文楷合成纯文本图片,包含千字文及假名 灰阶 https://github.com/lxgw/LxgwWenKai
纯文本 genyomin 使用源樣明朝体合成纯文本图片,较其他样本加大字号,包含千字文及常见繁体字 灰阶 https://github.com/ButTaiwan/genyo-font
纯文本 crimson 使用Crimson Text合成纯文本图片,包含英文衬线体普通、粗体、斜体,降采样后无处理 灰阶 https://fonts.google.com/specimen/Crimson+Text
书籍 realbook 图书《圈圈教你玩USB》节选扫描,作者: 刘荣 灰阶 相关法律
彩图 color 为避免色彩推理错误,添加彩图数据。含colored manga 漫画数据集及其他一些ACG彩色图片,缩小1/2使用 彩色 https://www.kaggle.com/datasets/ultraamvking/colored-manga

担心污染暂未使用的数据,备选

类型 文件前缀 来源 备注 链接
钢琴谱 piano 钢琴谱电子档,非出版物
漫画 manga OpenMantra 漫画机器翻译评估数据集 https://github.com/mantra-inc/open-mantra-dataset

关于模型

我已经使用Real-ESRGAN和此数据集训练基于官方x2plus预训练模型的2x微调模型。

扫描书修复效果-输入输出对比图: 样本
扫描书修复效果-与官方模型对比: 样本1 样本1

模型 SourceBook-X2 X4plus X4plus-Anime Animevideov3-X4
缩放倍率 2 4 4 4
速度 Baseline 0.29x 0.94x 7.14x
  • 以上评估均使用ncnn模型测试

下载

ncnn模型及Windows、Linux推理程序见本仓库release页面: https://github.com/tumuyan/SourceBook-Dataset/releases

pth模型下载(训练log也在huggingface仓库中): https://huggingface.co/tumuyan/SourceBook/tree/pth/models

colab推理(使用pth模型): https://colab.research.google.com/drive/1E2IEo1zUapxMuOb2Px3VYy_zhDsu9OTR?usp=sharing

目录结构

├─beforecrop            // 分辨率>480*480未切片的图片,备用
└─test                  // 测试评估数据,未切分
└─sourcebook            // Real-ESRGAN 训练数据集
    ├─meta_info         // 图像文件清单
    ├─sourcebook_hr     // 高分辨率图像
    └─sourcebook_lr     // 低分辨率图像

相关法律

中华人民共和国著作权法

第二十四条 在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害:

(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;

...

(六)为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;

More Repositories

1

RealSR-NCNN-Android

An Android application for super-resolution & interpolation. Contains RealSR-NCNN, SRMD-NCNN, RealCUGAN-NCNN, Real-ESRGAN-NCNN, Waifu2x-NCNN, Anime4kcpp, nearest, bilinear, bicubic, AVIR...
C++
1,045
star
2

Tree-Style-History

Not only show browser history in tree style. 不止用树状形式展示浏览器历史 (For Edge / Chromium / Chrome)
JavaScript
182
star
3

AnyLauncher

You can choose any Android application and set it as a Luncher.
Java
126
star
4

MusicBeePlug_AlbumCover

A Artwork Provider Plug-in for MusicBee.
C#
56
star
5

video-shuffler-for-aegisub

Script for Aegisub to cut video and voice files | 在Aegisub中用字幕切割视频和音频文件
Lua
19
star
6

rime-pinyin-jap

李さんの日本語入力方法。一個Rime日語方案,完全忽略音読訓読,使用漢語拼音录入日語漢字字形,使用羅馬音録入仮名。適用於基本不懂日語並且無意深入学習,但是又有一定日語書写的人。
Lua
17
star
7

video-shuffler

Cut video to clips and shuffle them by ass file | 洋片箱:用ASS字幕文件切割视频,并重组输出
Python
14
star
8

ESRGAN-Android-TFLite-Demo

TFLite Super Resolution for Android with ESRGAN model, modify from https://github.com/tensorflow/examples/tree/master/lite/examples/super_resolution/android
C
10
star
9

realsr-models

models for realsr
6
star
10

trime-peach

同文输入法辅助工具(安卓端rime输入法的方案、词库、滤镜、脚本的订阅、下载、导入、应用、同步工具)
4
star
11

Auto-Mute

一个能自动静音后台标签页的Chrome/Edge浏览器扩展
JavaScript
4
star
12

Rime-Pinyin-9Key

Rime九宫拼音,基于【袖珍简化字拼音】和【Rime 简体中文用户定制文件】
Lua
3
star
13

libMediainfo-Android

把Mediainfo Android版代码改为使用预编译so文件,从而降低了编译难度。如果有Android libmediainfo使用需求,能快速导入到自己的项目中。
Kotlin
2
star
14

Regulatable-Flashlight

A Android demo to control flash LED
Java
2
star
15

MPC-Shader

Shader for MPC-BE
HLSL
1
star
16

Dict-Trick

生成字典的若干小工具
Java
1
star
17

Bilibili-live-on-Alipay-IoT

基于支付宝Iot小程序官方示例搓的直播小程序
JavaScript
1
star
18

WikiFilter

统计词库的每个词条在文本文件的多少行中出现过
Python
1
star
19

ArduEx

利用Arduino的IO资源,使用(PC/手机)对产品进行快速调试。
C++
1
star