Parquet

    Parquet就是基於Dremel的數據模型和算法實現的,面向分析型業務的列式存儲格式。輔以按列的高效壓縮和編碼技術,實現降低存儲空間,提高IO效率,降低上層應用延遲。 列式存儲 可以跳過不符合條件的數據,只讀取需要的數據,降低IO數據量。 壓縮編碼可以降低磁盤存儲空間。由於同一列的數據類型是一樣的,可以使用更高效的壓縮編碼(例如Run Length Encoding和Delta Enco
相關文章
相關標籤/搜索