• Stars
    star
    155
  • Rank 239,426 (Top 5 %)
  • Language
    Python
  • Created over 8 years ago
  • Updated over 5 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

一个简单的python爬虫,原生python+BeautifulSoup

Pythonspider,一个简单的python爬虫

  • 娱乐随手写的,代码不太严谨,仅仅实现功能
  • 原生python+BeautifulSoup4
  • python3.4版本
  • 所有脚本要和spider.py放到同一目录下
  • 自行下载BeautifulSoup4 的类库 window下 pip install bs4即可

爬取知乎的爬虫 zhihu.py

  • 主要实现 爬取一个收藏夹 里 所有问题答案下的 图片
  • 文字信息暂未收录,可自行实现,比图片更简单
  • 具体代码里有详细注释,请自行阅读

子文件夹文件说明:

文件名 说明
*.py文件 爬虫程序
*.sql文件 数据表结构
*.html文件 数据展示
*.php文件 数据展示界面数据接口