史上最全的spark總結

1.什麼是spark? spark是基於內存計算的通用大數據並行計算框架,是一個快速、通用可擴展的大數據分析引擎。它給出了大一統的軟件開發棧,適用於不一樣場合的分佈式場景,如批處理、迭代算法、交互式查詢、流處理、機器學習和圖計算。 2.Spark生態系統? SparkCore:spark的核心計算 主要Rdd SparkSQL:提供了類sql方式操做結構化半結構化數據。對歷史數據進行交互式查詢。(
相關文章
相關標籤/搜索