第一章 spark數據分析導論

1.1 spark是什麼 spark是一個用來實現快速而通用的集羣計算的平臺。 spark比mapreduce更加高效,適用於各種原先需要多種不同分佈式平臺的場景,包括批處理、迭代算法、交互式查詢、流處理。 1.2 一個大一統的軟件棧 spark的核心是一個對由很多計算任務組成的、運行在多個工作機器或者是一個計算集羣上的應用進行調度、分發以及監控的計算引擎。 spark各組件如下圖所示。 1.2.
相關文章
相關標籤/搜索