• Stars
    star
    602
  • Rank 74,409 (Top 2 %)
  • Language
    Scala
  • License
    Apache License 2.0
  • Created over 8 years ago
  • Updated about 3 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

Learning Apache spark,including code and data .Most part can run local.

为了更好的学习和理解spark,也为了记录自己学习过程中遇到的各种问题,方便以后查询,故写了相关博客,也公开了代码和数据,代码基本都可以本地(local)运行。论文部分由于是ppt,故没有放上来。

0.总目录:

SparkLearning博客:http://blog.csdn.net/bob601450868/article/category/5730447
SparkLearning代码和数据:https://github.com/xubo245/SparkLearning
书籍和视频等学习资料推荐: Spark学习资料汇总

1.环境

SparkLearning是在spark上运行的,spark搭建等请见spark官网或其他网站。 SparkLearning运行环境:
jdk1.7
maven 3.3.9
Spark-1.5.2
scala-2.10.4
idea 15.04/eclipse-4.3.2
spark-assembly-1.5.2-hadoop2.6.0.jar(下载地址: http://pan.baidu.com/s/1hrSxiDI)

2.说明:

SparkLearning项目带有数据,下载会比较慢,如果只想下载部分文件夹,可以使用svn。另外也在20160810弄了一个没有数据的project,方便下载:https://github.com/xubo245/SparkLearning_NoData

3.具体博客目录:

(1).Spark基本学习篇: 

SparkBaseLearning文档
SparkBaseLearning代码

(2).Spark代码篇:

SparkCodeLearning文档
SparkCodeLearning代码

(3).Spark组件之Mllib学习篇

MLlibLearning文档
MLlibLearning代码

(4).Spark组件之SparkSQL学习篇

SparkSQLLearning文档
SparkSQLLearning代码

(5).Spark组件之SparkR学习篇

SparkRLearning文档
SparkRLearning代码

(6).Spark组件之Spark Streaming学习篇

SparkStreamingLearning文档
SparkStreamingLearning代码

(7). Spark组件之GraphX学习篇

GraphXLearning文档
GraphXLearning代码

(8).Spark-Avro学习篇

SparkAvroLearning文档
SparkAvroLearning代码

(9).Spark生态之Alluxio(Tachyon)学习篇

AlluxioLearning文档
AlluxioLearning代码

(10).Spark生态之spark-csv篇:

SparkCsvLearning文档
SparkCsvLearning代码

(11).Spark疑问篇

SparkQuestion文档

(12).MLLearning:

MLLearning文档
MLLearning代码

MLlibLearning project: https://github.com/xubo245/MLlibLearning

(13). Spark源码学习

SparkSourceLearning文档
SparkSourceLearning代码

Help

If you have any questions or suggestions, please write it in the issue of this project or send an e-mail to me: [email protected]

Wechat: xu601450868
QQ: 601450868

More Repositories

1

MLlibLearning

Spark MLlib Learning
GCC Machine Description
69
star
2

CarbonDataLearning

Apache CarbonData Learning
Scala
53
star
3

SparkLearning_NoData

SparkLearning_NoData, including code,pom and so on
Scala
12
star
4

GeneDataProcess

Adam Learning (bigdatagenomics)
Scala
5
star
5

kechengliu

课程流是一个方便学生和老师的课程交流平台。老师可以在课程流上发布课程,包括课程信息、老师信息、助教信息、作业信息、课程信息、通知等;学生可以选择加入自己感兴趣的课程,也可以建立自己选择课程的课程主页,并在课程里面发布信息,进行问题交流,推荐学习资料等。 课程流旨在为学生和老师提供一个良好的学习交流平台,为非计算机专业或者烦于修改代码来创建课程主页的用户提供一个快捷方便课程主页简历和维护的平台,解决目前信息不集中和交流不便的现状,节省用户时间,提高效率,而且将课程主页汇到一起可以有选择性的学习自己没修的课程,便于自主学习和讨论交流。
4
star
6

Spark2Learning

spark-2.X Learning
Scala
3
star
7

JNILearning

java native interface,include java,scala,c,c++
C++
2
star
8

Homepage

Homepage是一个个人主页的模版,使用的是静态网页技术,可以在线展示个人信息
JavaScript
2
star
9

GCDSS

GCDSS:Distributed Gene Clinical Decision Support System Based on Cloud Computing
Scala
1
star
10

neo4j_java

neo4j、java、Cypher
1
star
11

CloudBWA

CloudBWA: a distributed read mapping algorithms in GCDSS
Shell
1
star
12

liuyangzhang

浏阳张彩瓦,含公司介绍,图片展示,新闻报道,注册预定等
HTML
1
star