大数据学习
大数据学习的资料整理。
经典文章
对大数据给出 整体认识(架构/场景/方案说明) 或是 重点说明(关键组件及其特点) 。
- 100 open source Big Data architecture papers for data professionals
# 中文译文:PayPal
高级工程总监:读完这100篇论文就能成大数据高手 - The Log: What every software engineer should know about real-time data's unifying abstraction
# 中文译文:日志:每个软件工程师都应该知道的有关实时数据的统一抽象
来自LinkedIn
的Kreps
发表的一篇博文,虽然很长,但是被称为程序员 史诗般必读 文章。 日志原本应该是运维人员掌握的,如今也是研发人员必须关心的,这是符合DevOps
原则。 Google
公开的大数据领域论文
已有的资料汇编
- 分布式系统(Distributed System)资料 by @ty4z2008
- 大数据应用与技术 - 入门资源汇编 by @memect
- 详细的领域列表 - Awesome Big Data
- The Hadoop Ecosystem Table
书籍
个人整理的大数据书籍豆列
讨论 & 科普
典型技术
- 初识大数据:
Hadoop
、Spark
、Storm
- 如何用形象的比喻描述大数据的技术生态?
Hadoop
、Hive
、Spark
之间是什么关系? - 大数据处理技术的趋势-五种开源技术介绍
Storm
与Spark
:谁才是我们的实时处理利器