parquet與avro嵌套列存結構比較

paruet列存文件結構圖:數組 如上圖,文件由一個或者多個行組Row Group組成,每一個行組由多個列組成,每一個列由多個頁面組成,頁面由其頭部和Repetition levels、Definition levels和列的值values組成。ui 以上結構能夠在加載時追加record,record首先存在內存中,當內存不夠用時,將此時內存中全部的record組成一個行組Row Group輸出到
相關文章
相關標籤/搜索