• Stars
    star
    228
  • Rank 169,947 (Top 4 %)
  • Language
    Scala
  • Created almost 6 years ago
  • Updated 5 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理,实时处理,OLAP等,如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目,如用户画像、数据仓库等,欢迎感兴趣的小伙伴一起来开发...

大数据技术之路

本人从13年开始接触大数据,也算在大数据领域中摸爬滚打了很多年,本项目是我对大数据行业相关技术做些梳理。

1、Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

2、Spark

Spark是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序

3、Flink

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。
Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。

4、大数据生态圈一些其它技术框架

5、大数据相关技能前奏

6、大数据一些相关项目

7、数据相关知识点

8、大数据学习相关资料

8.1、大数据学习网站
8.2、大数据学习书籍
8.3、大数据论文
8.4、学习网址收藏

9、必会知识点