hadoop1架構基本理解

  0 出現原因:   業務場景:在1T數據中,找最小值 a) 集中式處理方式: 不斷從硬盤加載部分數據放在機器內存中處理,然後丟棄內存數據,繼續加載處理, 這樣CPU真正計算時間是很少的,大部分時間都用在了磁盤IO上, 硬盤轉速是固定的7200轉,相對於內存速度和CPU速度,這種物理瓶頸無法處理,影響了整個作業速率。 特點: 將數據加載到計算區   b) 分佈式處理方式: 1T的數據分散到多臺機
相關文章
相關標籤/搜索