淺析Hadoop文件格式

轉載地址:http://www.infoq.com/cn/articles/hadoop-file-format Hadoop 作爲MR 的開源實現,一直以動態運行解析文件格式並獲得比MPP數據庫快上幾倍的裝載速度爲優勢。不過,MPP數據庫社區也一直批評Hadoop由於文件格式並非爲特定目的而建,因此序列化和反序列化的成本過高[7]。本文介紹Hadoop目前已有的幾種文件格式,分析其特點、開銷及使
相關文章
相關標籤/搜索