大數據- MapReduce計算模型

時間 2020-12-30

原文原文鏈接

1.分佈式文件系統 1.1 數據激增以前，在數據量比較少的時候是單節點結構，CPU-Memory-Disk；後來，隨着互聯網的不斷髮展，數據量激增；以Google爲例：Google每天產生的網頁數量達到200TB，假設磁盤讀取帶寬爲50MB/sec，則讀取這些文件需要46天，後續的數據處理與操作話費的時間可能會更多。 1.2 分佈式文件系統分佈式文件系統結構如下： 1. 數據以「塊狀」形式在多

>>阅读原文<<