baolibin/Bigdata

Stars
264
Rank 155,103 (Top 4 %)
Language
Scala
Created over 6 years ago
Updated 10 months ago

baolibin/Bigdata

baolibin

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理，实时处理，OLAP等，如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目，如用户画像、数据仓库等，欢迎感兴趣的小伙伴一起来开发...

大数据技术之路

本人从13年开始接触大数据，也算在大数据领域中摸爬滚打了很多年，本项目是我对大数据行业相关技术做些梳理。

1、Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

Hadoop
- MapReduce
- HDFS
- YARN

2、Spark

Spark是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序

Spark

3、Flink

Apache Flink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。
Flink以数据并行和流水线方式执行任意流数据程序，Flink的流水线运行时系统可以执行批处理和流处理程序。

Flink

4、大数据生态圈一些其它技术框架

5、大数据相关技能前奏

6、大数据一些相关项目

7、数据相关知识点

8、大数据学习相关资料

8.1、大数据学习网站

8.2、大数据学习书籍

8.3、大数据论文

8.4、学习网址收藏

9、必会知识点

BigDataSourceCode

大数据相关源代码阅读(持续更新中...)。目前包括SparkCore、SparkSql、SparkStreaming、FlinkCore、ScalaLibrary、JavaSrc模块源码阅读。SparkCore包括部署Deploy模块、执行Executor模块、内存Memory模块、调度Scheduler模块、经典的Shuffle模块、存储Storage模块等等。

Algorithm

基本数据结构和算法学习笔记(持续更新中...)。慢慢滴~ 包括基本的数据结构和算法，如数组、链表、字符串、树、图、dp等等... 还有很多算法刷题代码，目前我和我女朋友一起开发。欧拉拉~欧拉拉~

Ml_Dl

机器学习/深度学习学习整理。慢慢滴~ 分类、回归、聚类、降维、推荐.../深度学习：cnn、rnn...

Program

项目开发基本技术~ (持续更新...) 包括Scala、Java、Python、shell、sql、git、maven、正则...欢迎感兴趣的小伙伴一起来开发...

Infrastructure

分布式原理-基础架构-中间件

Note

整理笔记，不断更新~