Hadoop:The Definitive Guid 總結 Chapter 1~2 初識Hadoop、MapReduce

1.數據存儲與分析 問題:當磁盤的存儲量隨着時間的推移越來越大的時候,對磁盤上的數據的讀取速度卻沒有多大的增長 從多個磁盤上進行並行讀寫操作是可行的,但是存在以下幾個方面的問題: 1).第一個問題是硬件錯誤。硬件越多出錯的機率就越大。一種常用的解決方式是數據冗餘,保留多分拷貝,即使一份數據處理出錯,還有另外的數據。HDFS使用的也是類似的方式,但稍有不同。 2).第二個問題是數據處理的相關性問題。
相關文章
相關標籤/搜索