MapReduce學習筆記

MapReduce學習筆記 一.MapReduce模型簡介 1.    MapReduce採用「分而治之」策略,一個存儲在分佈式文件系統中的大規模數據集,會被切分成許多獨立的分片(split),這些分片可以被多個Map任務並行處理 2.    MapReduce設計的一個理念就是「計算向數據靠攏」,而不是「數據向計算靠攏」,因爲,移動數據需要大量的網絡傳輸開銷 3.    MapReduce框架採
相關文章
相關標籤/搜索