Spark 原理與實踐

Spark 系統是分佈式批處理系統和分析挖掘引擎 ; AMP LAB 貢獻到 Apache 社區的開源項目,是 AMP 大數據棧的基礎組件;做什麼 數據處理( Data Processing ):可以用來快速處理數據,兼具容錯性和可擴展性。迭代計算( Iterative Computation ):支持迭代計算,有效應對多步的數據處理邏輯。 數據挖掘 ( Data Mining ):在海量數據基礎
相關文章
相關標籤/搜索