《hadoop權威指南(第四版)》(第一章)學習筆記

TB ==> PB ==> EB ==> ZB   有句話說得好:「大數據勝於好算法。   在硬盤存儲容量多年來不  斷提升的同時,訪問速度(硬盤數據讀取速度)卻沒有與時俱進。 讀完整個硬盤中的數據需要更長時間,寫入數據就別提了。【讀入數據比寫數據快】 一個很簡單的減少讀取時間的辦法是同時從多個硬盤上讀數據。   大多數分析任務需要以某種方式結合大部分數據來共同完成分析, MapReduce提出一
相關文章
相關標籤/搜索