• Stars
    star
    4,304
  • Rank 9,568 (Top 0.2 %)
  • Language
    Jupyter Notebook
  • License
    Other
  • Created over 4 years ago
  • Updated 7 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

pandas中文教程

Joyful-Pandas

基于Joyful Pandas教程编写的纸质版书籍已在各大网络平台上线,欢迎选购。本书使用新版的1.4.0,对网页版教程(基于1.2.0)内容作了大量修订,包括内容增改以及习题更新,同时增加了数据可视化、特征工程和性能优化三个章节的内容。本书设计练一练共计121题,章后习题共计41题,各章节分布与目录见后文。有关本书籍和pandas的任何问题可以在本仓库提issue,或者加最后的二维码进讨论群提问。

购买链接:

在写作期间,本书作者积极参与pandas的开发工作和社区建设,点击此处查看开源贡献。同时,Joyful Pandas也被pandas官方增选为社区推荐教程,在此对pandas核心开发组多年来的长期维护和社区建设表示感谢!

纸质版

  • 数据集:下载(提取码:9e8r)
  • 参考答案:链接
  • 勘误修订:链接
  • 练一练与习题
章节 练一练(题数) 习题(*为纸质版新增)
第一章 预备知识 15 一、利用列表推导式实现矩阵乘法
二、计算卡方统计量
* 三、统计某商店的月度销量情况
第二章 pandas基础 8 * 一、整理某服装店的商品情况
* 二、汇总某课程的学生总评分数
三、实现指数加权窗口
第三章 索引 6 * 一、实现sample()函数
二、公司员工数据的索引操作
三、巧克力评价数据的索引操作
第四章 分组 10 一、汽车数据的分组分析
* 二、某海洋物种在三大海域的分布研究
三、实现transform()函数
第五章 变形 9 * 一、某连锁店的库存统计
* 二、整理某地区的化石燃料数据
三、特殊的wide_to_long()方法
第六章 连接 5 一、合并员工信息表
二、实现join()函数
* 三、条件连接
第七章 缺失数据 6 * 一、缺失数据筛选
二、K近邻填充
* 三、条件近邻插值
第八章 文本数据 3 一、房屋数据的文本提取
* 二、巴洛克作曲家的年龄统计
* 三、汇总显卡测试的结果
第九章 分类数据 2 一、统计未出现的类别
二、钻石数据的类别构造
* 三、有序类别下的逻辑斯蒂回归
第十章 时间序列数据 10 一、太阳辐射数据的时序分析
二、水果销量分析
* 三、使用Prophet进行时序预测
第十一章 数据观测 15 * 一、图片绘制
* 二、数据观测实战
* 三、基于PyOD库的异常检测
第十二章 特征工程 12 * 一、卡方分箱
* 二、基于标签的特征构造
* 三、信用卡诈骗数据的特征工程
第十三章 性能优化 20 * 一、DNA链的碱基序列处理
* 二、捕捉电信号的激活态区间
* 三、药物靶点的关联性分析
* 四、物质浓度的指标检测
* 五、设计滑窗类
  • 新增的三个章节目录
第十一章 数据观测 11.1 可视化方法 11.1.1 基本绘图
11.1.2 元素控制
11.1.3 子图控制
11.2 数据观测方法 11.2.1 数据类型
11.2.2 数据统计量
11.2.3 数据分布
11.2.4 基于数据报告的观测
11.3 习题 /
第十二章 特征工程 12.1 单特征构造 12.1.1 特征变换
12.1.2 文本数据特征
12.1.3 时间序列数据特征
12.1.4 单特征构造的一般方法
12.2 多特征构造 12.2.1 分组技术
12.2.2 特征降维
12.3 特征选择 12.3.1 基于统计量的选择
12.3.2 基于模型的选择
12.4 习题 /
第十三章 性能优化 13.1 pandasic代码要义 /
13.2 多进程加速 13.2.1 多进程和多线程
13.2.2 多进程的陷阱
13.2.3 异步进程
13.2.4 进程中的数据共享
13.2.5 在pandas中使用多进程
13.3 利用Cython加速 13.3.1 初识Cython
13.3.2 优化策略
13.3.3 多线程加速
13.3.4 Cython类及其应用
13.3.5 模块构建
13.4 利用Numba加速 13.4.1 noPython模式
13.4.2 ufunc与向量化
13.4.3 jitclass及其应用
13.5 习题 /

网页版

http://joyfulpandas.datawhale.club/

文件内容

  • data:网页版教程数据集
  • ebook:网页版教程电子版
  • notebook:网页版教程notebook

参考资料

交流群

关注Datawhale公众号,回复关键词“熊猫”获得二维码

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可

More Repositories

1

pumpkin-book

《机器学习》(西瓜书)公式详解
22,983
star
2

leedl-tutorial

《李宏毅深度学习教程》(李宏毅老师推荐👍),PDF下载地址:https://github.com/datawhalechina/leedl-tutorial/releases
Jupyter Notebook
9,384
star
3

llm-cookbook

面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版
Jupyter Notebook
8,853
star
4

easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Jupyter Notebook
8,032
star
5

competition-baseline

数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路
Jupyter Notebook
3,978
star
6

fun-rec

推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/
Jupyter Notebook
3,304
star
7

hugging-llm

HuggingLLM, Hugging Future.
Jupyter Notebook
2,425
star
8

daily-interview

Datawhale成员整理的面经,内容包括机器学习,CV,NLP,推荐,开发等,欢迎大家star
HTML
2,258
star
9

team-learning

主要展示Datawhale的组队学习计划。
2,153
star
10

thorough-pytorch

PyTorch入门教程,在线阅读地址:https://datawhalechina.github.io/thorough-pytorch/
Jupyter Notebook
1,916
star
11

learn-nlp-with-transformers

we want to create a repo to illustrate usage of transformers in chinese
Shell
1,660
star
12

statistical-learning-method-solutions-manual

统计学习方法习题解答,在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual
Jupyter Notebook
1,563
star
13

team-learning-data-mining

主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
Jupyter Notebook
1,504
star
14

key-book

《机器学习理论导引》(宝箱书)的证明、案例、概念补充与参考文献讲解。
1,375
star
15

self-llm

《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程
Jupyter Notebook
1,352
star
16

llm-universe

本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/
Jupyter Notebook
1,133
star
17

hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果
Jupyter Notebook
1,041
star
18

hugging-multi-agent

A tutorial based on MetaGPT to quickly help you understand the concept of agent and muti-agent and get started with coding development
CSS
917
star
19

team-learning-nlp

主要存储Datawhale组队学习中“自然语言处理”方向的资料。
Jupyter Notebook
827
star
20

team-learning-program

主要存储Datawhale组队学习中“编程、数据结构与算法”方向的资料。
Jupyter Notebook
803
star
21

dive-into-cv-pytorch

动手学CV-Pytorch版
Python
781
star
22

wonderful-sql

Follow me,从 0 到 1 掌握 SQL。
625
star
23

machine-learning-toy-code

《机器学习》(西瓜书)代码实战
Jupyter Notebook
520
star
24

so-large-lm

大模型理论基础
508
star
25

leetcode-notes

🐳 LeetCode 算法笔记:面试、刷题、学算法。在线阅读地址:https://datawhalechina.github.io/leetcode-notes/
490
star
26

fantastic-matplotlib

Matplotlib中文教程,在线阅读地址:https://datawhalechina.github.io/fantastic-matplotlib/
Python
436
star
27

torch-rechub

A Lighting Pytorch Framework for Recommendation Models, Easy-to-use and Easy-to-extend.
Python
341
star
28

powerful-numpy

巨硬的NumPy
Jupyter Notebook
324
star
29

whale-quant

本项目为量化开源课程,可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。
Jupyter Notebook
322
star
30

learn-python-the-smart-way

聪明方法学Python,简明且系统的 Python 入门教程。
Jupyter Notebook
301
star
31

team-learning-cv

主要存储Datawhale组队学习中“计算机视觉”方向的资料。
Jupyter Notebook
289
star
32

vced

VCED 可以通过你的文字描述来自动识别视频中相符合的片段进行视频剪辑。该项目基于跨模态搜索与向量检索技术搭建,通过前后端分离的模式,帮助你快速的接触新一代搜索技术。
Python
270
star
33

d2l-ai-solutions-manual

《动手学深度学习》习题解答,在线阅读地址如下:
Jupyter Notebook
249
star
34

juicy-bigdata

🎉🎉🐳 Datawhale大数据处理导论教程 | 大数据技术方向的开篇课程🎉🎉
Python
226
star
35

office-automation

python自动化办公
Jupyter Notebook
211
star
36

team-learning-sql

主要存储Datawhale组队学习中“SQL”方向的资料。
172
star
37

DOPMC

Datawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
169
star
38

learn-python-the-smart-way-v2

聪明办法学Python,简明且系统的 Python 入门教程第二版。
Jupyter Notebook
142
star
39

ensemble-learning

Jupyter Notebook
124
star
40

smoothly-vslam

VSLAM开源基础教程,各章节练习代码
C++
122
star
41

joyrl

An easier PyTorch deep reinforcement learning library.
Python
121
star
42

free-excel

开源Excel教程。
CSS
120
star
43

faster-git

a chinese tutorial of git
113
star
44

unusual-deep-learning

水很深的深度学习
105
star
45

agent-tutorial

96
star
46

grape-book

图深度学习(葡萄书),在线阅读地址: https://datawhalechina.github.io/grape-book
HTML
96
star
47

undingable-optimization

顶不住的运筹优化
92
star
48

sweetalk-design-pattern

基于《大话设计模式》对设计原则和设计模式进行解读。
C++
79
star
49

hugging-sd

Hugging StableDiffusion, Hugging Future.
Jupyter Notebook
76
star
50

hands-dirty-nlp

本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。
Jupyter Notebook
73
star
51

sora-tutorial

69
star
52

joyrl-book

Jupyter Notebook
66
star
53

huawei-od-python

华为OD算法题解
Python
64
star
54

paper-chart-tutorial

《科研论文配图》组队学习
50
star
55

wow-plotly

高级可视化神器plotly的学习
Jupyter Notebook
49
star
56

time-series-learning

天池”AI Earth“气象海洋预测竞赛的Topline学习教程
Jupyter Notebook
48
star
57

go-talent

Go天才小队
Go
47
star
58

zishu

wow-fullstack,令人惊叹的全栈开发教程
Jupyter Notebook
46
star
59

whale-anno

Datawhale自研数据标注工具
Vue
43
star
60

openmmlab-tutorial

帮助新手快速入门、快速使用、习惯 OpenMMLab 开源库官方文档且能够自主上手实验,自由选择阅读更深层的知识。
Jupyter Notebook
42
star
61

rl-papers

rl-papers
38
star
62

whale-paper

Datawhale论文分享,阅读前沿论文,分享技术创新
35
star
63

whale-starry

繁星点点,光芒万丈
C++
34
star
64

team-learning-rl

主要存储Datawhale组队学习中“强化学习”方向的资料。
28
star
65

llms-from-scratch-cn

Jupyter Notebook
28
star
66

whale-web

Python
27
star
67

ML-FTTI

机器学习 - 从原理到实现
Python
26
star
68

aima-notes

人工智能:现代方法(第4版)笔记
24
star
69

awesome-compression

模型压缩的小白入门教程
23
star
70

magic-cv

Jupyter Notebook
20
star
71

llm-research

16
star
72

coggle

Coggle数据科学
15
star
73

hugging-audio

Hugging Face Audio Course中文版,帮助学习者快速入门音频模态
Jupyter Notebook
14
star
74

easy-grokking-deep-learning

Easy-Grokking-Deep-Learning,意为轻松摸索深度学习,英文缩写可简称为EGDL。
Python
11
star
75

leeml-notes

leeml-notes已更名为leedl-tutorial,请访问:https://github.com/datawhalechina/leedl-tutorial
10
star
76

datawhale-linklearner

datawhale linklearner 网站
TypeScript
9
star
77

sweetalk-data-structure

电子书阅读地址
8
star
78

hugging-rl

Robot Learning Algorithms
8
star
79

what-is-vs

5
star
80

HandPoseKeyPoints

5
star
81

design-and-analysis-of-algorithm

4
star
82

hello-net

4
star
83

fun-marl

4
star
84

easy-ros2arm

Robotic arm with machine vision and its os is ROS2.
C++
3
star
85

ai-club

Datawhale 高校联盟
3
star
86

camel-agent-tutorial

This is a tutorial based on the CAMEL framework, aimed at understanding how to build an Agent Society from the ground up!
3
star
87

obsession-with-ai

2
star
88

latex-template

Datawhale LaTex Template
TeX
2
star
89

udl-tutorial

2
star
90

llm-deploy

2
star
91

whale-share

1
star
92

sweettalk-django

Python
1
star
93

whale-governance

Datawhale 组织治理小组负责推动组织持续发展,包括组织架构、文化、制度等工作
1
star
94

start-deep-learning-on-graphs

start-deep-learning-on-graphs
1
star
95

move-as-experts

Imitation Learning and Offline Reinforcement Learning.
1
star
96

datawhale-homepage

datawhale 官网介绍页
CSS
1
star
97

caublazer

Python
1
star
98

leegenai-tutorial

1
star