• Stars
    star
    618
  • Rank 72,605 (Top 2 %)
  • Language
    Jupyter Notebook
  • Created about 7 years ago
  • Updated about 5 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

📔 在学院的书架上发现了一本不带脑子就能读懂的书《Python数据挖掘与实战》

PythonDataMining 在线浏览 [ 推荐 ]

FOSSA Status

在学院的书架上发现了一本不带脑子就能看懂的书《Python数据挖掘与实战》

  • pdf 在当前目录./下,有 黑白图中文版彩色图表补充

    • pdf 体积略大(8.8Mb),github 直接打开比较慢,建议clonefork
  • 随书附带的代码在./BOOK_CODE文件夹下面,全英文

    • 原书有些数据集不包含在内,因为这些数据需要从其他网站上下载,而网站已经更新,书编写时的数据很难再找到
    • 有些数据还要翻墙才拿得到,比如第六章”使用朴素贝叶斯进行社交媒体挖掘”时,数据集需要通过twitterAPI来获取,要在代码里翻墙
    • 我根据书中的需要,一个一个重新把数据集找到,放到./data目录下(包括书编写时的数据、需要翻墙的数据)
  • 阅读笔记在当前目录./下,这是在随书附带的代码的基础上做的中文版

  • 最后,厚着脸皮要 star ,嘤嘤嘤~~

本地浏览

环境:python3.x, jupyter notebook

pip install notebook # 安装笔记本
jupyter notebook # 启动笔记本

笔记目录

  1. 数据挖掘流程简单示例10min.ipynb
  2. 用近邻算法分类.ipynb
  3. 用决策树预测获胜球队.ipynb
  4. 用亲和性分析推荐电影.ipynb
  5. 用转换器抽取特征.ipynb
  6. 用朴素贝叶斯进行社会媒体挖掘.ipynb
  7. 用图挖掘找到感兴趣的人.ipynb
  8. 用神经网络破解验证码.ipynb
  9. 作者归属问题.ipynb
  10. 新闻语料分类.ipynb
  11. 用深度学习进行图象分类.ipynb
  12. 大数据处理.ipynb

问题解决记录

  1. Python Tweepy 翻墙抓取Twitter信息

免责声明

本仓库没有英文原版的文件,只有网友翻译的中文版文件。中文版具体来源记不清了。如有问题可随时联系我删除相关文件。

License

FOSSA Status

More Repositories

1

LaTeX_OCR_PRO

🎨 数学公式识别增强版:中英文手写印刷公式、支持初级符号推导(数据结构基于 LaTeX 抽象语法树)Math Formula OCR Pro, supports handwrite, Chinese-mixed formulas and simple symbol reasoning (based on LaTeX AST).
Jupyter Notebook
1,052
star
2

LaTeX_OCR

💎 数学公式识别 Math Formula OCR
Jupyter Notebook
486
star
3

DictionaryData

高质量英语字典,400多本单词书+60000多个单词!单词书包括小学、中学、高中、考研、考博、出国(GRE、托福等等)等等,难道它不香吗?
282
star
4

chatgpt-review-rebuttal-extension

ChatGPT - Review & Rebuttal: A browser extension for generating reviews and rebuttals, powered by ChatGPT. 利用 ChatGPT 生成审稿意见和回复的浏览器插件
TypeScript
249
star
5

lifecycle-component

🏆 一套组件化规范,基于组件的生命周期,支持渐进式组件化、渐进式组件变插件化,高度自由的成长性架构
Java
141
star
6

PyTorch-DDPM

500 行代码实现降噪扩散模型 DDPM,干净无依赖
Jupyter Notebook
122
star
7

MLang

Android 动态化多语言框架,支持语言包的动态下发、升级、删除,一处安装,到处使用
Java
108
star
8

DragBoardView

⭐ Android 看板,支持项拖拽、列拖拽。Draggable kanban/board view for Android.
Java
107
star
9

Data-for-LaTeX_OCR

LaTeX OCR 的数据仓库
90
star
10

TFLEX

[NeurIPS 2023] TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph
Jupyter Notebook
29
star
11

Python-100-Days-CheatSheet

百日python,路线:语法->爬虫->网站->数据科学->机器学习->深度学习
12
star
12

KGE-toolbox

知识图谱基础设施
Python
11
star
13

notes

📖 机器学习笔记 Notes for Machine Learning
Jupyter Notebook
9
star
14

ranger_icon_plugin

Ranger plugin that adds icon support to Ranger
Python
7
star
15

EthereumDappTutorial

💡 以太坊去中心化网页app
JavaScript
7
star
16

data_cookbook

数据处理、数据可视化。有关pandas、pyecharts、d3等,轮子代码备忘,以后直接抄。
5
star
17

QubitE

code for "QubitE: Qubit Embedding for Knowledge Graph Completion"
Python
5
star
18

Numerical-Solution-of-Differential-Eequations

微分方程数值解法 Matlab 实现
MATLAB
4
star
19

LearnTelegram

一个长期的学习 Telegram 的计划,加中文注释供自己理解
Java
4
star
20

hash2face

map Hash to Face using GAN.
Python
4
star
21

AnimPlayer

公主连结人物精灵动画播放器
HTML
4
star
22

SmsDelayer

Android 手机短信转发器,转发至另一手机短信、邮箱、服务器。含服务端代码。
Java
4
star
23

FLEX

code for "FLEX: Feature-Logic Embedding Framework for CompleX Knowledge Graph Reasoning"
Python
4
star
24

RecommenderSystem_PyTorch

速通推荐系统
Jupyter Notebook
3
star
25

streamlit-markdown

a streaming markdown component for streamlit with LaTeX, Mermaid, Table, code support. A drop-in replacement for st.markdown.
JavaScript
3
star
26

project-TimeCat

时光猫官网
HTML
3
star
27

project-recite-words

被动背单词!每 1000 毫秒显示一个单词,就算一个小时记住只 5 %,也是 3600 * 0.05 = 180 个! 只要重复次数足够多,效率低又有什么呢?
HTML
3
star
28

tutorial_matlab

matlab
2
star
29

BGEA

Python
2
star
30

EchoEA

code for "EchoEA: Echo Information between Entities and Relations for Entity Alignment"
Python
2
star
31

DemoAppleBackend

练手项目,熟悉一下 Spring Boot
Java
1
star
32

KG_datasets

知识图谱常用数据集
1
star
33

TimeCatGradle

时光猫的 gradle 构建脚本,统一配置
Kotlin
1
star
34

LinXueyuanStdio

为 github 的个人主页添加一个README吧!!!
1
star
35

gotools

handy tools written with golang
Go
1
star
36

timecat-doc

时光猫文档
1
star
37

LearnManim

随便学一下3b1b画图
Python
1
star
38

LinXueyuanStdio.github.io

Blog for recording my learning process.
HTML
1
star
39

GradleDependancyReport

android 依赖可视化管理:包大小、包依赖、kotlin支持、打开浏览器查看
Groovy
1
star
40

TimeCatRepoTemplate

时光猫仓库模板
Java
1
star
41

learnGit

learn git from demand
1
star
42

TimeCatModuleTemplate

时光猫业务组件模板
Kotlin
1
star
43

TimeCatPlugin-PluginManager

时光猫插件 插件管理,插件上传
Java
1
star
44

SAMView

单Activity多View框架,不使用Fragment
Java
1
star
45

TimeCatModule-Plugin

时光猫组件 插件宿主
Java
1
star
46

TimeCatShadow

从腾讯的 Shadow 而来
Java
1
star
47

TimeCatMaven

打包aar减少编译时间
1
star
48

CodeFilesTemplate

CodeFileStruct Template for MachineLearning 代码文件组织结构模板
Python
1
star
49

settings

some useful settings
Shell
1
star
50

latex_template_mcm

2018美赛论文模板
TeX
1
star
51

UEdbq

伤害优衣的家伙在哪里?噢,是我啊,优衣对不起😁
Java
1
star
52

ComponentAnalysis

组件化分析
Vue
1
star
53

UAIcup

UAI CUP https://biendata.com/competition/UAI/
Jupyter Notebook
1
star