Cloudera和Twitter將Parquet帶入Hadoop領域

Cloudera與Twitter攜手合作,爲Hadoop開源了一種新的列式存儲格式,稱爲Parquet。 二人說,由 Github託管的項目 旨在爲 Hadoop生態系統的任何齒輪部分 提供「 壓縮的,高效的列式數據表示」,這意味着Parquet與語言和數據模型無關。 像Impala和Apache Drill等新興項目一樣, Parquet大量借鑑了Google在2010年發表的研究論文 Drem
相關文章
相關標籤/搜索