Spark基礎入門

最近在研究spark,spark現在可以算是最流行的大數據計算框架啦,mr只能進行離線計算的批處理,presto,implala進行交互式查詢,storm只能進行流計算,而spark恰恰集成了這些。我這篇文章只進行基礎入門的介紹(系統架構,運行模式)。 - spark和mr的比較 spark把計算中間數據放到內存(cache,persist),mr的map階段和ruduce階段都需要進行溢寫落盤,
相關文章
相關標籤/搜索