• Stars
    star
    199
  • Rank 194,959 (Top 4 %)
  • Language
    Python
  • Created almost 7 years ago
  • Updated about 5 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

爬虫-百度百科-知识图谱探索

Python 2.x 爬虫 + D3 数据可视化

抓取百度百科985高校信息

所属城市 中文名 英文名 创办时间 简称 知名校友 主要院系
city name enName date short friend dept

数据来源:

image

数据处理:补全信息、分词、统一格式

image

最后效果图:

image

Demo访问地址:http://47.95.209.24:3000/(暂时无法访问,服务器搬家中。。。)

内容(按处理顺序):

  • list-school 高校列表
  • loadingData 获取高校信息
  • stopwords 分词
  • entity 分离实体
  • node-links 生成json数据(节点和关联关系)
  • html D3.js的数据可视化

原文作者博客

原文作者代码

我的博客,记录学习、记录生活:

https://s-top.github.io