菜鳥先飛之Hadoop數據模型

一、Hadoop常用數據模型(文件存儲格式) 1、Text:文本文件通常採用CSV、JSON等固度長度的純文本格式 優點: (1)便於與其他應用程序(生成或讀取分隔文件)或腳本進行數據交換 (2)易讀性好,便於理解 缺點: (1)數據存儲量非常龐大 (2)查詢效率不高 (3)不支持塊壓縮 2、SequenceFile: (1)SequenceFile按行存儲二進制鍵值對數據,HDFS自帶    
相關文章
相關標籤/搜索