• Stars
    star
    7
  • Rank 2,294,772 (Top 46 %)
  • Language
    Python
  • Created over 6 years ago
  • Updated over 6 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

爬取知乎特定问题回答下的所有评论,包括:昵称,内容,赞同数。存入MongoDB中。以"如何看待温州乐清 20 岁女生乘坐滴滴顺风车遇害 ?是否反应出客服系统存在问题?"问题下的回答评论作为例子。

More Repositories

1

bosszhipin_spider

基于BOSS直聘“数据分析师”职位信息的爬虫实现、数据分析、数据可视化及机器学习预测与结果分析。
Python
61
star
2

Ele-Spider

饿了么商家信息爬虫
Python
31
star
3

BaiduRankingSearch

SEO工具:【百度收录排名查询工具】查询指定域名/指定标题 在【百度】批量关键词下前50位的收录排名情况。(可部署在服务器上)
Python
20
star
4

data-science-salary-forecast

基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。
Jupyter Notebook
19
star
5

LA-Metro-Bike-Share-Analysis

基于Kaggle数据集“洛杉矶共享单车数据”进行的数据探索与分析。
Python
15
star
6

ziroom_ml_analysis

基于自如租房上海房源的聚类分析与数据可视化。
Python
15
star
7

nike_spider

爬取耐克中国官网所有商品信息,包括商品名称,商品类别,当地价格,员工价格。将结果存入MongoDB。
Python
7
star
8

wechat-assistant

微信操控的电脑小助手(实时拍照+人脸识别,远程关机,远程打开应用程序)
Python
6
star
9

spider-music163

网易云音乐个人用户主页小爬虫。抓取用户首页下“最近一周” ”所有时间“的听歌排行榜中的歌曲及歌词;抓取用户创建的所有歌单以及用户收藏的歌单;进一步抓取用户歌单下的所有歌曲信息。
Python
5
star
10

uk-college-charts

模拟登录知乎,爬取关注的所有英国大学话题下的精选回答下的评论,用SnowNLP极性分析,pyecharts绘制图表
Python
4
star
11

facial-recognition

win10下基于opencv库和face_recognition库的摄像头实时人脸识别小应用
Python
4
star
12

zhihu_top_answers

模拟登录后,爬取所关注的所有话题以及话题下的所有精选回答,包括回答下的所有评论。
Python
3
star
13

job-description-NLP-analysis

基于BOSS直聘“数据分析师|商业分析师”职位信息内职位描述的自然语言处理与分析。
Python
3
star
14

uk-Ecommerce

基于Kaggle上“UK E-commerce”数据集进行的数据分析。
Python
1
star
15

ziroom-spider

自如租房爬虫(针对了自如页面价格的爬虫策略),分别爬取上海各个区的所有住房信息。存储到MongoDB。并进行数据分析
Python
1
star
16

spider_zhilian

智联招聘爬虫
Python
1
star
17

github-discovery

cookie模拟登陆GitHub,爬取基于你感兴趣的话题和人推荐的repositories(Discover repositories)
Python
1
star
18

zhihu_user

通过一个种子用户,获取种子用户的关注者,再获取种子用户关注者的关注者,进而爬取所有知乎用户。目前爬取了3万多条用户信息(昵称,回答数,粉丝数,性别),利用pandas去重得1万多条数据,筛选粉丝数大于1000的用户得到7000多条。后续数据分析工作暂待更新。
Python
1
star