Spark簡介與功能

Spark是基於內存計算的大數據分佈式計算框架。Spark基於內存計算,提升了在大數據環境下數據處理的實時性,同時保證了高容錯性和高可伸縮性,容許用戶將Spark部署在大量廉價硬件之上,造成集羣。緩存 1.提供分佈式計算功能,將分佈式存儲的數據讀入,同時將任務分發到各個節點進行計算;框架 2.基於內存計算,將磁盤數據讀入內存,將計算的中間結果保存在內存,這樣能夠很好的進行迭代運算;機器學習 3.支
相關文章
相關標籤/搜索