Parquet 學習筆記

背景 2010年 google 發表了一篇論文《Dremel: Interactive Analysis of Web-Scale Datasets》,介紹了其 Dermel 系統是如何利用列式存儲管理嵌套數據的,嵌套數據就是層次數據,如定義一個班級,班級由同學組成,同學的信息有學號、年齡、身高等。 Parquet 是 Dremel 的開源實現,作爲一種列式存儲文件格式,2015年稱爲 Apach
相關文章
相關標籤/搜索