大數據技術 -- MapReduce 簡介

本文爲senlie原創,轉載請保留此地址:http://www.cnblogs.com/senlie/ 1.概要 很多計算在概念上很直觀,但由於輸入數據很大,爲了能在合理的時間內完成,這些計算 必須分佈在數以百計數以千計的機器上。例如處理爬取得到的文檔、網頁請求日誌來計算 各種衍生數據,如倒排索引,網頁文檔的各種圖結構表示,從每個主機上爬取的文檔數, 在某一天最頻繁的查詢的集合。 MapReduc
相關文章
相關標籤/搜索