• Stars
    star
    442
  • Rank 98,677 (Top 2 %)
  • Language
    Jupyter Notebook
  • License
    MIT License
  • Created almost 5 years ago
  • Updated over 2 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

Tutorial of geospatial data processing using python 用python分析时空数据的教程(in Chinese and English )

English
本教程的b站视频地址:https://www.bilibili.com/video/BV1A5411a7xz
本教程的github地址:https://github.com/ni1o1/pygeo-tutorial
本教程的gitee地址(国内访问快):https://gitee.com/ni1o1/pygeo-tutorial
由于网速或者各种问题,网页打开本教程可能会出现图片或文件显示不能,因此建议各位下载教程到本地后用jupyter notebook打开教程观看

如何使用本教程

本教程是在python的Jupyter notebook上编写,有些python的基础环境需要配置:

  1. Python环境: Python3.6/3.7均可,这里推荐装一个Anaconda,点击这个链接下载安装(Python是个编程语言,Anaconda是一个打包了数据分析常用功能的Python平台,安装Anaconda就已经包含Python本体)
    关于如何使用anaconda的Jupyter notebook可以看这个链接
  2. 把本教程搞到本地,点击本网页右上角的Clone or download,用git clone或者直接Download ZIP下载到本地。
  3. 安装本教程最核心的包:Python的geopandas包,点击这个链接,按照上面的方法安装(比较推荐里面的Installing from source的方法安装)。
  4. 打开教程,enjoy!

教程目录

基础的数据处理

  1. 出租车数据的基础处理,由gps生成OD(pandas)
  2. 出租车数据的集计与基础图表绘制(matplotlib)
  3. 出租车数据的地理信息处理(geopandas)
  4. 基于出租车GPS的OD期望线绘制与底图添加(plot_map)
  5. 绘制数据分布的散点图和热力图(contourf)
  6. 结构化数据的存储及处理的思维训练(理论课)

用python实现GIS处理

  1. 轨道客流可视化!shapely初探
  2. 用道路切分地块!shapely的线转面处理!
  3. 利用osmnx与plot_map计算并可视化街道方向_by_YuanLianggg

爬虫

  1. 爬虫爬API抓取行政区划(urllib)
  2. 抓抓抓包!用百度迁徙数据计算人口恢复率
  3. 抓微博!微博评论关系可视化(微博api)

可视化

  1. 基于folium的可交互地图可视化(folium)
  2. 基于pyecharts的可交互可视化(pyecharts)
  3. 利用pandana可视化城市设施的可达性_by_fff2zrx
  4. 好看又高大上的可视化pydeck入门

项目

  1. 实战项目:怎么当一个优秀的出租车手-1
  2. 实战项目:怎么当一个优秀的出租车手-2

学术课

  1. 主成分分析PCA的原理、实现、缺陷及改进
  2. 谱聚类的原理及实现
  3. 基于自表达性的深度子空间聚类
  4. 社区发现!Fast unfolding算法分析出租车社区

教程说明

大数据时代到来,随着数据的逐步开放,数据工作者们或多或少都要接触到时空数据。

小旭学长曾经说:The data is data since it's data.

是的!数据处理是一门艺术!在处理时空数据的时候,你不仅要数据处理,还需要会GIS,最重要的它是一门艺术,要用你的审美,要出很好看的可视化图!

以前,我要用sql数据库处理数据,导出到excel画图表,再导出到arcgis出图,一套流程下来得开好几个软件,工作效率极低。

上次老师跟我说:小旭啊,我们这个项目你给我出800张图吧,我这周五就要。这个其实画出来也没什么用,主要是想放我们项目文本的附录里显示我们的工作量
我当场把桌子掀起来,画你妹!老子这博不读了
不,以上是做梦,现实情况是: 我微笑着说,好的老师,我通宵画

现在,python出现了,有了python里面的pandas,geopandas,matplotlib包,只需要用python就能实现数据的批量计算,批量出gis图等等。

哇!太棒了!简直是读研、读博、设计院画图、数据分析、闲着没事、居家旅行时候都必须会的技能,别说800张图了,电脑空间有多少我就能生成多少图,包您满意

通过本教程,你将从头开始,会学到一些时空数据的处理技巧,用python进行数据清洗,数据集计,数据整合,可视化!教程的后半段介绍了几个常用的python可视化包,最后是实战项目

本教程的可视化效果图展示

使用数据

本教程的数据来源(公开数据集可直接下载):
深圳出租车数据
Urban Data Release V2
Taxi GPS Data Format: 22223,2013-10-22 08:49:25,114.116631,22.582466,0
Taxi ID, Time, Latitude, Longitude, Occupancy Status, Speed; Occupancy Status: 1-with passengers & 0-with passengers;

学习本教程需要的基础

在学习本教程之前,强烈建议各位已经掌握了python的最基础的编程语法。如果你还没有掌握,下面建议你完成:

小甲鱼的python入门视频(看到35P)

另外,推荐课程:

  1. imooc的Python数据分析-基础技术篇教程
  2. udacity的数据分析入门课程
  3. coursera的机器学习课程
  4. 莫烦PYTHON的pytorch动态神经网络课程

友情链接

小旭学长的Echarts作品

贡献者

ni1o1ni1o1

fff2zrxfff2zrx

YuanLiangggYuanLianggg