• Stars
    star
    147
  • Rank 249,863 (Top 5 %)
  • Language
    Python
  • Created over 7 years ago
  • Updated 5 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

yande.re图片爬虫

Yande.re图片爬虫

前言

手动刷图费时费力,至少我是这么想的。于是就有了这个项目及后续更新

本项目基于Win7, Python3.5.2Win10, Python3.6.7开发,在Ubuntu16.04, Python3.5.2运行成功,其他环境未考虑。

功能

  • 支持从指定的开始页码爬取到结束页码
  • 也支持从第一页爬取到上一次开始爬取的位置
  • 支持设置爬取的图片类型(全部、横图、竖图、正方形)
  • 支持最大或最小图片尺寸宽高比限制
  • 支持限制爬取的图片体积
  • 按照当天的日期创建目录并存放爬取的图片
  • 爬取结束后会在图片目录下生成日志文件
  • 支持tag搜索与排除
  • (可选)GUI

如何使用

可选

编辑config.jsonfolder_path参数,设为自己想要的目录,如文件夹不存在将会自动创建。路径必须以斜杠结尾。

可接受的分隔符只有/\\\将被认为是转义字符而报错。

剩下的参数可以运行后根据提示修改。

Windows下命令行执行python index.pypython GUI.py均可,Linux下可直接执行。

注意事项

每次运行后config.jsonlast_stop_id参数会被自动修改为爬取到的第一张图片的ID,便于下一次爬取时只爬取新post,无论停止条件为ID或是页码。

更新日志

2.0

新增:tag搜索,图形界面与并行下载

1.0

终于完成了啦