大數據- MapReduce計算模型

1.分佈式文件系統 1.1 數據激增 以前,在數據量比較少的時候是單節點結構,CPU-Memory-Disk;後來,隨着互聯網的不斷髮展,數據量激增;以Google爲例:Google每天產生的網頁數量達到200TB,假設磁盤讀取帶寬爲50MB/sec,則讀取這些文件需要46天,後續的數據處理與操作話費的時間可能會更多。 1.2 分佈式文件系統 分佈式文件系統結構如下: 1. 數據以「塊狀」形式在多
相關文章
相關標籤/搜索