Spark經典面試題(二)

1.什麼是spark? spark是基於內存計算的通用大數據並行計算框架,是一個快速、通用可擴展的大數據分析引擎。它給出了大一統的軟件開發棧,適用於不一樣場合的分佈式場景,如批處理、迭代算法、交互式查詢、流處理、機器學習和圖計算。 2.Spark生態系統? SparkCore:spark的核心計算 主要Rdd SparkSQLa:提供了類sql方式操做結構化半結構化數據。對歷史數據進行交互式查詢。
相關文章
相關標籤/搜索