Hadoop數據壓縮

壓縮技術能夠要寫減少底層存儲系統(HDFS)讀寫字節數。磁盤I/O和網絡帶寬是Hadoop的寶貴資源,數據壓縮對於節省資源,最小化磁盤I/O和網絡傳輸非常有幫助。可以在任意MapReduce階段啓用壓縮。 壓縮是提高Hadoop運行效率的一種優化策略 通過對Mapper輸入,Mapper輸出,Reducer輸出數據進行壓縮,以減少磁盤IO,提高MR程序運行速度。 注意:採用壓縮技術減少了磁盤IO,
相關文章
相關標籤/搜索