Spark基本知识( 二 )


Spark核心模块

Spark基本知识

文章插图
Spark Core
Spark Core 中提供了 Spark 最基础与最核心的功能 , Spark 其他的功能如:Spark SQL,
Spark Streaming,GraphX, MLlib 都是在 Spark Core 的基础上进行扩展的
Spark SQL
Spark SQL 是 Spark 用来操作结构化数据的组件 。通过 Spark SQL , 用户可以使用 SQL
或者 Apache Hive 版本的 SQL 方言(HQL)来查询数据 。
Spark Streaming
Spark Streaming 是 Spark 平台上针对实时数据进行流式计算的组件,提供了丰富的处理
数据流的 API 。
Spark MLlib
MLlib 是 Spark 提供的一个机器学习算法库 。MLlib 不仅提供了模型评估、数据导入等
额外的功能,还提供了一些更底层的机器学习原语 。
Spark GraphX
GraphX 是 Spark 面向图计算提供的框架与算法库 。
【Spark基本知识】

推荐阅读