人工智能实战就业(面试)学习路线图
- 这个项目是干什么的?
资料存在太多数据集,百度网盘被举报后已经无法分享链接,后续将提供谷歌网盘
领取资料请直接加微信:Gp00006666 (验证信息备注GITHUB即可)
整理这个项目的初衷是方便同学们快速开启人工智能自学计划,在学习过程中少走弯路用最快的效率入门Ai并开始实战项目, 提供了近200个Ai实战案例和项目,这些并不是网上搜集来的,而是我这五年线上线下教学所开发和积累的案例。可以说都是 反复迭代更新出来的,适合同学们来进行循序渐进的学习与练手。来的同学记得点个star收藏下!
- 配套教材如何获取?
19年底我出版了机器学习课程的配套教材《跟着迪哥学Python数据分析与机器学习实战》, 风格依旧是通俗易懂,历时两年反复修改订正十余次终于和大家见面了。 为了方便更多同学们能快速开始学习计划,我决定将本书的电子版免费送给大家。希望它能给大家带来学习的收获! 在本项目主页即可下载PDF版本,教材如果喜欢也可从京东购买。
《跟着迪哥学Python数据分析与机器学习实战》PDF原版下载 :
(网盘链接: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ 提取码: tece )
- 按照什么顺序开始学习?
下面目录也就是学习路线路了,初学者建议按照目录中给出的顺序来进行学习,已经入门的同学就可以按照自己的喜好来选择了。
- 提供案例如何获取?
案例中涉及的数据都是真实数据集,有些会比较庞大,直接上传github大家下载起来会非常慢,我会逐渐上传各个模块 的网盘链接,里面包括了数据,代码,PPT等学习资源。如需配套视频讲解请添加微信:digexiaozhushou(迪哥小助手拼音)
- 合作与交流
有各方面合作交流以及项目问题都可以直接添加微信:digexiaozhushou(迪哥小助手拼音)
目录
必备基础技能
要学人工智能(数据科学)这行还是需要一些基本功的,最基础也是最核心的就是Python和数学了!这两兄弟入门起来 并不难,先掌握基础的边用边学也是可以的!
必备Python基础
如果对Python不熟悉的同学们,建议先看一下我的Python入门视频课程,可以快速入门!传送门
- 为什么是Python?
最直接的解释就是大家都用它!以前是面向对象编程,后来大家更喜欢面向复制粘贴编程,现在懒到面向github编程,确实如此,该偷懒就得偷懒,Python就是这个作用! 后续所有的实战内容都是基于Python,所以没得选啦!
- 需要安装什么?
Anaconda就够了!Anaconda就够了!Anaconda就够了!好了,说了三遍了,具体解释大家参考上面传送门课程就好
- 用什么编程工具开始? 虽然大家都有趁手的兵器,但是我给大家准备的绝大多数课件都是基于jupyter notebook的,所以这个肯定是必备的!
必备Python工具包
- 什么是工具包?
工具包就是人家把功能都写好了,咱们直接调用就完事啦!数据处理,分析,建模等都有对应的工具包。对于学习来说 并不用把这些工具包背下来,先熟悉起来,后续肯定还是要现用现查的。
- 哪些工具包是初学者必备的呢?
工具包名称 | 功能概述 |
---|---|
Numpy | 矩阵计算必备!它是后续一切计算的核心,数据科学领域核心工具包 |
Pandas | 数据处理必备!读数据,处理数据,分析数据,非他不可! |
Matplotlib | 可视化必备!功能十分强大,没有画不出来的图,分析展示就靠它了! |
Seaborn | 更简单的可视化神器!一行代码给你搞定一个可视化展示结果 |
必备数学基础
- 数学重要吗?非学不可吗?
数学有多重要同学们肯定都十分清楚,尤其是在人工智能(数据科学)领域,不懂数学想必寸步难行,很多同学都问过我一个问题,工作中真能用上这么多数学吗? 我跟大家来解释一下,人工智能这行发展相当迅速,在实际工作中肯定要边干边学,学什么呢?想必就是当下的一些优秀论文了,如果连基本的数学公式都看不懂, 那就不用再去谈什么高端技术了。做这行的同学们肯定都会有这样一个想法,所谓的人工智能就是对数据做各种各样的数学计算罢了!
- 如何学数学?要定一个长期计划吗?
对于数学我觉得并不需要从头开始花大量时间一步一个脚印去学习,举一个例子,我和我身边的同事,朋友都是干这行蛮久的了,数学不知道撸了多少遍了,考研时候也曾刷题无数, 但也会遇到这样的问题,很多知识点如果一段时间没看很快还是会忘记。我最常做的一件事就是用到什么查什么,查找的过程其实也是学习进步过程。建议大家可以快速过一遍 常用的知识点(高数,线性,概率论中的基础),这个过程中千万别去看各种解题过程,也不用管具体求解的方法,说白了就是只要理解一个公式是做什么的,有什么用 就足够了,类似教材中的习题,练习册上的求解这些统统不需要,以后也根本不会用笔去算这些麻烦事,把这个时间省下来去学习算法更划得来!
- 下面是课程中所设计的知识点,也是必备基础
知识点 | 内容 | 作用 |
---|---|---|
高等数学 | 高等数学基础,微积分,泰勒公式与拉格朗日, | 机器学习公式推导必备 |
线性代数 | 线性代数基础,特征值与矩阵分解, | 算法求解必备 |
概率论 | 概率论基础,随机变量与概率估计,常用分布 | 机器学习经常提这些词 |
统计分析 | 回归分析,假设检验,相关分析,方差分析 | 数据分析必备 |
机器学习
人工智能领域最核心的就是机器学习了,无论大家后续想从事哪个方向,肯定都是先从机器学习开始!主要就两件事, 第一就是掌握经典算法原理,第二就是熟练应用Python工具包进行建模实战!
机器学习算法
-
算法要学什么? 理解机器学习算法是如何对数据进行操作从而完成建模求解过程,说白了就是熟悉下数学在算法中是如何应用的。重在理解即可!不要对一个问题钻的没完没了,这样太 浪费时间了,没准后续学习过程中一下子就迎刃而解了。我觉得对算法的学习肯定不止一遍,尤其是准备面试就业的同学们,二刷,三刷都是很正常的现象(曾经有同学 跟我说面试前一共刷了6遍课程)
-
有了深度学习还需要机器学习吗?
深度学习可以说是机器学习算法的一种,并不是有了神经网络其他经典算法就不需要了,需要根据不同的任务和数据来选择最合适的算法,学习路径肯定是先从机器学习开始, 其实掌握了这些经典算法之后再看神经网络真的很简单!
- 下面是课程中会讲解的算法,也是大家必须掌握的!这里没有列出所有机器学习算法,因为有很多现在已经不实用了。
知识点 | 内容 | 概述 |
---|---|---|
分类算法 | 逻辑回归,决策树,支持向量机,集成算法,贝叶斯算法 | 准备面试的同学们必须掌握 |
回归算法 | 线性回归,决策树,集成算法 | 有些算法既能做分类也能做回归 |
聚类算法 | k-means,dbscan等 | 无监督是实在没标签的时候才考虑的 |
降维算法 | 主成分分析,线性判别分析等 | 重在理解降维的思想 |
进阶算法 | GBDT提升算法,lightgbm,,EM算法,隐马尔科夫模型 | 进阶算法有时间精力的同学们可以挑战 |
机器学习算法实验分析
通过对比实验分析经典算法建模方法及其参数对结果的影响,通过实验与可视化展示理解算法中的参数与应用实例。
案例名称 | 内容概述 |
---|---|
线性回归实验分析 | 掌握一元与多元线性回归,非线性回归方法,正则化惩罚的作用 |
模型评估方法 | 常用分类与回归算法评估方法对比,数据集切分实例 |
逻辑回归实验分析 | 经典分类模型构造方法,决策树边界绘制方法 |
聚类算法实验分析 | 无监督建模实例,聚类算法评估方法,无监督的作用与应用实例 |
决策树实验分析 | 树模型可视化实例与构造方法,树模型的分类与回归应用 |
集成算法实验分析 | 集成方法应用实例与效果分析,常见集成策略对比 |
支持向量机实验分析 | SVM涉及参数与建模对比实验 |
关联规则实战分析 | 关联规则必备知识点与建模分析实例 |
机器学习算法代码复现
为了更好理解算法的机制从零开始复现经典算法,坚持不掉包原则,一步步完成算法所需所有模块。
- 为什么要自己复现代码?有何价值呢?
主要目的是更好的掌握算法的工作原理,重在练习!有时间的同学们可以自己复现一遍,时间紧的同学就不必亲力亲为了。
案例名称 | 内容概述 |
---|---|
线性回归代码实现 | 分模块构建算法常用函数 |
逻辑回归代码实现 | 实例解读逻辑回归实现方法 |
Kmeans代码实现 | 非常简单易懂的无监督算法 |
决策树代码实现 | 树模型其实就是递归实现 |
神经网络代码实现 | 代码量略大,建议debug模式学习 |
贝叶斯代码实现 | 贝叶斯在文本任务中还是比较好解释 |
关联规则代码实现 | 常用的数据分析算法 |
打造音乐推荐系统 | 从零开始构造推荐系统模型 |
机器学习经典案例实战
- 实战需要掌握哪些技能?
在实战中可能把数学知识点都弱化了,因为更多时候我们都是使用现成的工具包来完成任务(调包侠)。这里需要大家掌握的节能功能比较多, 首先就是熟练使用这些常用工具包了,数据预处理,特征工程,调参,验证这些都是非常核心的步骤。概括来说就是要完成不同的任务所需流程和套路都是类似的, 但是使用的方法和算法却可能不同,这就需要大家不断积累来丰富实战经验了。给同学们提供的这些案例大家都可以当作是自己的实战模板!
- 这些案例能让我收获什么?
最重要的就是学会针对不同数据(数值,文本,图像)如何进行预处理与分析,熟练应用工具包中各大核心函数进行调参与预处理,针对不同任务提出多种解决 方案并进行实验分析。总结起来就是多做实验,多动手,代码写的多了自然就熟练了!
案例名称 | 内容概述 |
---|---|
K近邻算法实战 | 机器学习入门案例,掌握工具包应用于建模方法 |
交易数据异常检测 | 十分重要,数据处理和建模策略的详细分析对比 |
集成算法建模实战 | 集成不用我多说了,必备核心策略 |
基于随机森林的气温预测 | 随机森林是机器学习中最常用的算法,详细分析对比 |
新闻分类实战 | 文本数据分析处理,基于贝叶斯算法展开建模实战 |
聚类实践分析 | 无监督应用实例 |
时间序列分析 | 时间序列数据制作方法,基于序列数据进行建模 |
用户流失预警 | 我经常说梦幻西游的用户流失,这个只是个DEMO |
使用lightgbm进行饭店流量预测 | 又是一个大杀器,比xgboost还虎 |
人口普查数据集项目实战-收入预测 | 核心模板,数据分析,可视化啥的该有的都有 |
贝叶斯优化实战 | 难度较大,贝叶斯优化工具包使用实例 |
文本特征方法对比 | 文本数据常用特征提取方法对比 |
制作自己常用工具包 | 自己做个包玩玩 |
机器学习实战集锦
- 这里还给大家准备了丰富的实战项目,非常适合大家来练手!
案例名称 | 内容概述 |
---|---|
Python实战关联规则 | 用工具包来做关联规则实在太轻松了 |
爱彼迎数据集分析与建模 | 房价数据集分析与建模实例 |
基于相似度的酒店推荐系统 | 来构建一个推荐系统完成酒店推荐 |
商品销售额回归分析 | 销售额预测,很常规的任务,常规套路搞定 |
绝地求生数据集探索分析与建模 | 绝地求生数据集,来看看你究竟被什么人干掉了 |
模型解释方法实战 | 建模后如何来解释模型呢,这几个工具包帮你搞定 |
自然语言处理必备工具包实战 | NLP常用工具包解读,实例演示 |
银行客户还款可能性预测 | 银行客户数据来预测还款的可能性 |
图像特征聚类分析实践 | 图像数据如何进行聚类呢? |
人口普查数据集项目实战-收入预测 | 核心模板,数据分析,可视化啥的该有的都有 |
数据分析与挖掘
数据分析这个词大家天天都在听,要干什么呢?无非就是从数据中获取有价值的信息,这其中方法与套路还是非常多的。 这个方向不需要什么理论积累,直接上数据,干就得了!案例的积累就是学习过程!
数据挖掘实战
- 数据挖掘是什么?和机器学习有什么区别?
简单来说数据挖掘就是对海量数据应用机器学习算法来得到想要的结果。在数据挖掘中重点并不是机器学习算法的选择,而是怎么样对数据进行处理才能得到更好的 预测结果,在这里特征工程与预处理将成为核心解决方案。
案例名称 | 内容概述 |
---|---|
泰坦尼克号获救预测 | 经典的kaggle竞赛案例,入门数据挖掘的第一个实战项目 |
数据特征构建 | 特征工程是数据挖掘的核心,基于sklearn讲解多种特征构建方法 |
用户画像实战 | 用户画像想必大家都听过了,如何应用数据来完成画像呢? |
集成策略实例 | 数据挖掘中选择通常都选择集成策略来更好的提升效果 |
Xgboost实战 | 集成中的典型代表,竞赛的大杀器 |
京东购买意向预测 | 经典预测问题,基于用户历史行为数据完成预测任务 |
kaggle数据科学调查 | 可视化展示kaggle竞赛中参赛人员情况 |
房价预测 | 数据挖掘入门级别案例,快速掌握常规套路 |
电力敏感用户分析 | 竞赛实例,主要讲解特征工程的作用 |
fbprophet时间序列预测 | 时间序列预测非常实用的算法,用起来非常简单 |
数据挖掘竞赛优胜解决方案
- 我又不参加竞赛,为什么要看人家的解决方案呢?
给大家选择了天池,kaggle,融机等大型竞赛案例,并且提供的代码和方案均为竞赛时优胜者的解决思路。就好比要学下棋就得跟下的最好的玩自己才会提升, 案例中均会讲解优胜者的思路和整体解决方案并提供代码实现。非常有助于大家提升!
案例名称 | 内容概述 |
---|---|
快手短视频用户活跃度分析 | 基于用户的行为数据来预测接下来的活跃程度 |
工业化工生产预测 | 对化工数据进行分析,建模预测生产效率 |
智慧城市-道路通行时间预测 | 很接地气的竞赛,基于道路数据预测通行时间 |
特征工程建模可解释工具包 | 数据挖掘中很难的一点就是进行特征解释,这些工具包非常实用 |
医学糖尿病数据命名实体识别 | 命名实体识别算法讲解与应用实例分析 |
贷款平台风控模型-特征工程 | 用图模型来构建特征工程,这套思路应用很广 |
新闻关键词抽取模型 | 关键词抽取可以说是NLP必备技能了 |
机器学习项目实战模板 | 模板来了,以后有任务可以套用了,方法都差不多 |
电力敏感用户分析 | 竞赛实例,主要讲解特征工程的作用 |
数据分析实战
- 数据分析的重点又是什么呢?
数据挖掘主要是建模来进行预测,数据分析则重在可视化展示,分析其中各项指标对结果的影响等。给大家选择了一些经典分析案例,很多都可以直接当作模板来使用
案例名称 | 内容概述 |
---|---|
散点图绘制技巧 | 都说了可视化是重点,画图肯定必须的了 |
纽约出租车运行情况分析建模 | 用了好多工具包,可以熟悉下对地理数据如何进行分析与展示 |
基于统计分析的电影推荐任务 | 统计分析常用方法,还能做推荐 |
数据分析与机器学习模板 | 这个模板真的非常全面了,分析,展示,建模,评估,简直一套龙了 |
数据降维 | 几种常用的降维算法对比分析与展示 |
商品可视化展示与文本处理 | 文本数据预处理与可视化展示 |
多变量分析 | 多变量分析也是数据分析中常见的方法 |
商品订单数据集分析 | 订单数据集分析 |
KIVA贷款数据分析 | 贷款数据集分析 |
深度学习
- 终于说到深度学习了,都需要学什么呢?
深度学习可以说是当下最好用的算法了,各个领域都能吃得开。其实最核心的还是在计算机视觉和自然语言处理中,因为神经网络算法更适用于图像和文本数据。 主要需要掌握的就是算法和框架了,算法就是CNN,RNN这些经典网络模型,框架就是实战的工具了例如tenorflow,Pytorch等,后面还会详细说。
- 深度学习听起来比较高大上,是不是比机器学习难很多?
好像现在好多小伙伴一拿到任务,第一个想法都是直接用深度学习做。如果深度学习难度大,做起来麻烦,那还能有这么高的热度吗?其实恰恰相反,我觉得深度学习 真的比机器学习简单很多,在机器学习中需要我们对不同的数据选择不同的预处理方法和特征工程构建方法。深度学习中的套路相对来说更固定一些,而且有这些开源框架 和各大经典网络架构,我们通常需要做的就是套用就可以了。整体难度要比机器学习任务更容易一些(只是相对来说!)。
深度学习必备算法
- 深度学习都需要学哪些算法呢?
算法名称 | 内容概述 |
---|---|
神经网络 | 神经网络是最基础的,相当于为后面网络的学习打下基础 |
卷积神经网络 | 这个大家听起来很熟悉吧,深度学习中的大哥大!计算机视觉的核心网络 |
递归神经网络 | 北乔峰,南慕容,它就是自然语言处理中的大哥大了! |
对抗生成网络 | 现在比较火的模型,玩起来很有趣,可以进行各种图像融合 |
序列网络模型 | NLP中常用架构,机器学习翻译模型,应用点比较多 |
各大经典网络架构 | 刚才说的CNN和RNN都是比较基础的网络模型,在其基础上还有很多拓展需要大家掌握 |
深度学习必备工具
- 什么是框架?能帮我们做什么呢?
框架好比说你设计了一个网络模型,但是如果把其中具体的计算过程全部自己完成就太麻烦了。框架提供了高效的计算方法并且不需要咱们来完成,一套全自动的计算。 相当于我们只需要设计好结构,具体的施工就交给它了。要玩深度学习必备的就是框架了。
- 深度学习框架哪家强?
tensorflow,Pytorch,keras,caffe等,有这么多框架,我该选哪一个呢?是不是不同框架差异很大呢? 现在最主流的就是tensorflow和PyTorch了,相当于肯德基和麦当劳吧。都很强,至于具体选择哪一个还是参考大家各自的项目组和任务需求吧。如果非要我推荐一个 我会给大家推荐PyTorch,因为更简洁通俗。这些框架我全都用过,最主要的原因就是工作中经常需要参考论文和开源项目,一般别人论文中源码用什么框架我也就接着进行 二次开发了,所以这些框架早晚大家都会用一遍的!
- 框架该怎么学呢?
框架没有什么理论可谈,也不用看各种长篇大论,直接用就得了!其实就是一个工具包,边用边学,案例当模板来总结就可以了!
- 针对不同框架,分别给大家准备了丰富的实战项目和学习内容。
框架名称 | 内容概述 |
---|---|
Caffe框架 | 远古时代的神级框架,现在有点跌落神坛了,我学习的第一个框架 |
Tensorflow2版本 | 2版本做了很多改进,终于更人性化了,用起来比1版本舒服多了 |
Keras | 一句话概述就是简单!简单!简单!都不用学,看代码非常容易理解 |
PyTorch | 现阶段最火的框架,我估计也是今年(2020)最流行的框架了,推荐! |
深度学习框架
针对各大深度学习框架均给大家提供了丰富的实战案例,用哪个就看大家的喜好了!
深度学习框架-Tensorflow2
- 请给我一个学tensorflow2的理由!
谷歌出品我就不用多解释了,人家谷歌那么多开源项目肯定都是基于TF框架的,要学习或者参考人家开源项目和论文肯定要学TF的,工业界应用也非常广泛。这波肯定不亏!
- 给大家准备的案例内容,借用程咬金的配音:一个字,干!
案例名称 | 内容概述 |
---|---|
tensorflow安装与简介 | 2版本的介绍于安装方法,简单过一下就好 |
神经网络原理解读与整体架构 | 复习下神经网络架构 |
搭建神经网络进行分类与回归任务 | 用TF完成基本的分类于回归任务,掌握其应用方法 |
卷积神经网络原理与参数解读 | CNN的架构于其中每一个参数详解 |
猫狗识别实战 | 经典的图像分类任务,这里要讲很多内容,非常重要 |
图像数据增强实例 | 数据增强可以说了现在必备技能了 |
训练策略-迁移学习实战 | 迁移学习带来的效果还是相当可以的 |
递归神经网络与词向量原理解读 | RNN模型解读 |
基于TensorFlow实现word2vec | 词向量模型解读,并基于TF来实现 |
基于RNN模型进行文本分类任务 | 基于TF完成文本分类任务 |
tfrecord制作数据源 | 数据源制作实例 |
将CNN网络应用于文本分类实战 | CNN也能玩文本分类 |
时间序列预测 | 时间序列数据处理与建模实例 |
对抗生成网络实战 | GAN来啦,这个可好玩了 |
基于CycleGan开源项目实战图像融合 | 我最喜欢玩的GAN,效果相当逗了! |
经典网络架构Resnet实战 | 必须懂的网络架构,学就得了! |
深度学习框架-Pytorch
- 听说它很火,为啥呢?
19年底Pytorch框架使用人数已经超越tensorflow成为当下最火的框架,原因其实很简单,大家都喜欢用更简单易懂的框架。整体的感觉确实比tensorflow好上手而且 调试起来十分方便,也是建议初学的同学们优先选择Pytorch框架。
案例名称 | 内容概述 |
---|---|
PyTorch框架基本处理操作 | PyTorch简单熟悉一下就好,上手非常简单 |
神经网络实战分类与回归任务 | 用PyTorch构建神经网络模型,确实比TF用的顺手 |
卷积神经网络原理与参数解读 | CNN模型架构与参数书解读 |
图像识别核心模块实战解读 | 非常重要,PyTorch中的图像处理核心模块 |
迁移学习的作用与应用实例 | PyTorch中加载模型来进行迁移学习 |
递归神经网络与词向量原理解读 | RNN模型架构解读 |
新闻数据集文本分类实战 | 基于PyTorch来构建文本分类模型 |
对抗生成网络架构原理与实战解析 | GAN模型通俗解读 |
基于CycleGan开源项目实战图像融合 | PyTorch版本的CYCLEGAN,这个开源项目写的相当棒 |
OCR文字识别原理 | OCR其实原理很简单,需要多个模型协助完成 |
OCR文字识别项目实战 | 构建OCR网络模型 |
基于3D卷积的视频分析与动作识别 | 用3D卷积来处理视频数据并完成行为识别 |
基于PyTorch实战BERT模型 | BERT这个架构太火了,必备模型之一 |
PyTorch框架实战模板解读 | 提供一个模板,以后有任务可以基于模板来进行改进 |
深度学习框架-Keras
- Keras都说简单,有多简单呢?
整体感觉就是啥都不用学,从案例开始直接用就好了,TF2版本其实跟keras很像。适合做实验写论文,简单快速!
案例名称 | 内容概述 |
---|---|
安装与简介 | keras安装与上手很容易,基于tf来进行 |
搭建神经网络模型 | 搭建个神经网络模型来试试水 |
再战卷积神经网络 | CNN模型构建起来也非常容易 |
LSTM时间序列预测任务 | LSTM模型应用于时间序列任务 |
文本分类实战 | 文本分类实例 |
多标签与多输出 | 多标签任务很常见,很有学习价值 |
新闻数据集文本分类实战 | 基于keras的文本分类任务 |
数据增强 | 数据增强实例解读 |
对抗生成网络 | GAN架构,用keras来做更简单 |
迁移学习与Resnet残差网络 | resnet模型大家一定自己动手玩一遍 |
地址邮编多序列任务 | 文本模型实例 |
seq2seq网络实战 | 序列网络模型应用还是比较广的 |
实战模板总结 | 给大家提供的keras模板,再有任务直接写就好 |
深度学习框架-Caffe
- Caffe框架现阶段还有必要学习吗?
我觉得现阶段已经有tensorflow和pytorch了,暂时轮不到caffe登场了,初学的同学们就不推荐了。可能有些论文和任务还是需要caffe框架,需要的同学们自取就好啦!
案例名称 | 内容概述 |
---|---|
Caffe配置文件解读 | Caffe框架常用配置文件解读 |
多种数据集构建方法 | 数据集构建方法,这个很重要 |
Caffe常用工具解读 | 里面内置了很多小工具,可以快速完成任务 |
人脸检测实战 | 基于Caffe框架构建人脸检测模型 |
人脸关键点定位实战 | 基于Caffe框架完成人脸关键点识别模型 |
计算机视觉
- 计算机视觉发展这么火,就业面试都需要哪些核心技能呢?
计算机视觉这个行业我就不用多说啦,当下最吃香的了。那都需要学什么呢?最核心的其实就两部分,一个是图像处理,另一个是图像建模。所谓的图像处理就是Opencv 那一套啦,这个工具包简直无敌了,但凡你要用的这里全能找到。图像建模主要就是用深度学习来完成检测,识别等任务。现阶段的学习我觉得关于传统图像处理算法可以 都不用去看啦,简单熟悉一下就好,主流的方向还是用深度学习来做,这就需要大家多多最新的阅读论文了。
Opencv图像处理实战
- 关于opencv我该怎么学呢?
建议大家选择Python版本来进行学习和使用,跟其他工具包一样,调就完事了!遇到不熟悉的多查API,边用边学是最快的途径。Opencv中基本所有函数都涉及非常多的 数学公式,这些大家都可以先放一放,如果把每个算法每个公式都学一遍那得猴年马月了,以后用到了再说完全来得及。
- 这些案例我需要自己动手写一遍吗?
给大家准备了非常多的学习资源和案例,前期只需要熟悉即可,工具包就是用的,面向复制粘贴编程也是一项技能!
案例名称 | 内容概述 |
---|---|
Opencv简介与环境配置 | 环境安装与配置 |
图像基本操作 | 用opencv完成基本的图像处理操作,练手! |
阈值与平滑处理 | 最常用的处理操作,几行代码就能搞定 |
图像形态学操作 | 这几个形态学操作熟悉下即可 |
图像梯度计算 | 图像梯度计算实例 |
边缘检测 | 边缘检测的应用面非常广 |
图像金字塔与轮廓检测 | 轮廓检测实例,效果还是不错的 |
直方图与傅里叶变换 | 熟悉下即可 |
项目实战-信用卡数字识别 | 动手做一个实战项目,对信用卡数字进行检测与识别 |
项目实战-文档扫描OCR识别 | 扫描文档数据,进行ocr识别 |
图像特征-harris | 常用特征提取方法,算法简单熟悉就可以 |
图像特征-sift | 最老牌的特征提取方法了,数学还是蛮多的 |
案例实战-全景图像拼接 | 全景摄像大家肯定都玩过,怎么实现的呢? |
项目实战-停车场车位识别 | 重型项目,从零开始构建停车场车位识别模型 |
项目实战-答题卡识别判卷 | 咱们也整一个自动阅卷的玩玩 |
背景建模 | 常规处理方法 |
光流估计 | 简单熟悉即可 |
Opencv的DNN模块 | 加载训练好的模型进行识别 |
项目实战-目标追踪 | 追踪的效果还是蛮有意思的 |
卷积原理与操作 | 卷积到哪都是核心 |
项目实战-疲劳检测 | 基于摄像头检测疲劳 |
计算机视觉实战项目(基于深度学习)
- 这些项目我都需要掌握吗?
对于准备面试就业的同学们建议都过一遍,里面的思想都是蛮好的,大部分都是基于论文来进行复现,有时间的同学最好 先阅读一遍论文再开始研究代码,里面的代码量都会相对较大,建议从debug模式入手,一行代码一行代码来看,我在 讲解过程中也会进入debug模式给大家逐行进行讲解。
- 有没有哪个是需要重点学习的?最好能写在简历里面呢?
重点推荐Mask-rcnn实战项目,可以说是计算机视觉中的通用项目,检测,识别,分割一步全到位了!应用场景非常 广,也适合进行二次开发和改进,如果要写在简历里肯定非它莫属了,算法原理和源码都需要大家熟悉,在课程中 我会重点讲解该项目,并应用到自己的数据任务中!
项目名称 | 内容概述 |
---|---|
图像风格转换(style-transfer) | 主要来学习其思想,效果还是很有意思的 |
图像缺失自动补全 | GAN网络应用场景非常多,图像也能自己修复 |
超分辨率重构 | 近几年研究的重点领域之一,这篇论文的效果已经非常不错了 |
物体检测框架-MaskRcnn项目 | 这个就是我重点强调的开源项目,必看!必看!必看! |
MaskRcnn网络框架源码详解 | 源码非常重要,每一行都需要懂! |
基于MASK-RCNN框架训练自己的数据 | 如何标注图像数据并进行训练呢?这里给你答案 |
人体姿态识别demo | MaskRcnn应用场景非常多 |
物体检测FasterRcnn系列 | 物体检测的经典之作,可以当作学习资源 |
基于CycleGan开源项目实战图像融合 | PyTorch版本的CYCLEGAN,这个开源项目写的相当棒 |
OCR文字识别原理 | OCR其实原理很简单,需要多个模型协助完成 |
OCR文字识别项目实战 | 构建OCR网络模型 |
基于3D卷积的视频分析与动作识别 | 用3D卷积来处理视频数据并完成行为识别 |
自然语言处理
- NLP学习难度大不大?就业方向怎么样呢?
难度可以说还是蛮大的,对于图像来说,数据都是固定的,拍了什么就是什么!但是文本数据就没那么固定了,人类 有时候理解起来都不容易,更何况计算机了。高挑战也是高收益,NLP发展前景还是非常不错的,至于具体选择哪个方向 其实还是看大家的喜好了!
自然语言处理实战项目(基于深度学习)
- 这么多项目,有没有哪个是需要重点学习的?最好能写在简历里面呢?
18年的时候谷歌一篇论文横空出世,BERT!相当于自然语言处理通用解决框架了,基本所有任务都能做! 这个需要大家重点来学习,并且可以当作项目写在简历里,可以说是当下NLP必备技能之一啦!
项目名称 | 内容概述 |
---|---|
语言模型 | 语言模型需要大家熟悉下,后续词向量的基础 |
使用Gemsim构建词向量 | Gensim这个包实在好用! |
基于word2vec的分类任务 | 先用这个例子来理解上如何使用词向量 |
NLP-文本特征方法对比 | 文本特征构造方法这么多,哪一个更好用呢? |
LSTM情感分析 | 用这个项目来理解RNN模型所需的输入长什么样子 |
NLP-相似度模型 | 文本相似度计算方法 |
对话机器人 | 基于tensorlfow框架构建一个聊天机器人 |
动手打造自己的输入法 | 能不能构建一款自己的输入法呢?帮你搞定! |
机器人写唐诗 | 看看模型写出的唐诗咋样! |
NMT机器翻译框 | 开源项目,可以进行二次开发 |
地址邮编多序列任务 | 经典文本分类任务 |
自然语言处理通用框架BERT原理 | 这个就是上面说的BERT了,重点!重点!重点! |
谷歌开源项目BERT源码解读 | 源码非常重要,每一行都需要理解 |
基于BERT的中文情感分析 | 基于开源项目进行模型开发 |
基于BERT的中文命名实体识别 | 基于开源项目进行命名实体识别 |
最后唠叨几句
通过这几年的线上课程还有线下的企业培训结识了很多小伙伴,机构和同学们的信任是我继续更新课程最大的动力 。大家认识我基本都是通过视频课程,很开心能给大家带来收获,记得最兴奋的就是跟家人分享又有小伙伴收获 offer了。感谢这么多小伙伴的支持,加油,你们都是最棒的!