Hadoop原理學習

一. Mapreduce 目前 1TB的數據,傳輸速度是100MB/s,單獨去讀出這份數據需要花費2個多小時的時間,這已經就相當的耗時,且只是1TB的數據 那麼 設想 有 100臺機器存100份數據進行同時讀寫,那麼我們可以在2min以內就完成了讀寫, 但是問題又來了,作爲分析來講,從一個磁盤讀出的數據常常需要和其他的99個盤獨處的數據合併使用,比如,排序,統計。 Hadoop就提供了這個功能,其
相關文章
相關標籤/搜索