pyDataScienceToolkits_Base
该项目仓库使用IPython Notebook方式介绍了Python的科学计算库NumPy、SciPy、Matplotlib和机器学习库Scikit-learn的使用入门。 所有内容系平时看书笔记和日常学习实验,希望对读者有帮助作用。
##NumPy入门部分
- NumPy数组基本操作——创建、索引、分片、改变维度
- NumPy数组基本操作——组合、分割、属性、转换
- NumPy常用函数——计算均值、最大最小值、中位数、方差
- NumPy常用函数——股票分析例子学习numpy
- NumPy便捷函数——相关性分析、多项式拟合等
- NumPy的矩阵和线性代数——矩阵基本使用、线性代数常用函数
- NumPy通用函数——通用函数、算术运算、位操作和比较函数
- NumPy的random模块——随机数、超几何分布、连续分布
- NumPy的排序与搜索
- NumPy断言函数
##Matplotlib绘图入门部分
##Scikit-learn机器学习库入门部分
- 从iris数据集入门scikit-learn——介绍使用KNN方法和sklearn进行模型训练预测的一般流程
- 介绍scikit-learn中如何进行模型参数的选择
- 介绍使用scikit-learn线性回归模型进行回归问题预测和特征的选择
- 介绍交叉验证及其用于参数选择、模型选择、特征选择的例子
- 介绍网格搜索来进行高效的参数调优
- 介绍评估分类器性能的度量,像混淆矩阵、ROC、AUC等
##Pandas数据分析处理入门