[大牛翻譯系列]Hadoop(16)MapReduce 性能調優:優化數據序列化

6.4.6 優化數據序列化 如何存儲和傳輸數據對性能有很大的影響。在這部分將介紹數據序列化的最佳實踐,從Hadoop中榨出最大的性能。html   壓縮 壓縮是Hadoop優化的重要部分。經過壓縮能夠減小做業輸出數據的儲存足跡,加速MapReduce做業下游接收數據。另外,在map和reduce之間的數據須要被壓縮以減輕網絡IO的壓力。壓縮技術的具體內容在第5章中介紹。網絡   二進制文件格式數據
相關文章
相關標籤/搜索