Hadoop學習筆記 --- 文件格式介紹

Hadoop 作爲MR 的開源實現,一直以動態運行解析文件格式並獲得比MPP數據庫快上幾倍的裝載速度爲優勢。 不過,MPP數據庫社區也一直批評Hadoop由於文件格式並非爲特定目的而建,因此序列化和反序列化的成本過高。 Hadoop文件格式簡介: (1)Sequence File SequenceFile是Hadoop API 提供的一種二進制文件,它將數據以<key,value>的形式序列化到文
相關文章
相關標籤/搜索