數據計算(大數據):MapReduce、Spark、Storm概述、特色、原理

MapReduce MapReduce將複雜的、運行於大規模集羣上的並行計算過程高度地抽象到了兩個函數:Map和Reduce。算法 特色:編程容易;分而治之策略(大規模數據集,會被切成許多獨立分片,分片由多個Map任務);計算向數據靠攏(設計理念)編程 函數架構 輸入框架 輸出機器學習 說明函數 Mapoop <k1,v1>如:學習 <行號,」a b c」>大數據 List(<k2,v2>)spa
相關文章
相關標籤/搜索