大數據學習筆記(二):Spark

本文僅提供一個入門概覽,部分內容來源於網絡,部分來源於自己理解,參考內容鏈接會在文末給出。 概述 Spark 是使用 scala 實現的基於內存計算的大數據開源集羣計算環境。它提供了 java,scala, python,R 等語言的調用接口。而且,Spark還支持豐富的高級工具集,包括用於SQL和結構化數據處理的SparkSQL,用於機器學習的MLlib,用於圖形處理的GraphX和Spark
相關文章
相關標籤/搜索