Java API 讀取Hive Orc文件

Orc是Hive特有的一種列式存儲的文件格式,它有着非常高的壓縮比和讀取效率,因此很快取代了之前的RCFile,成爲Hive中非常常用的一種文件格式。 在實際業務場景中,可能需要使用Java API,或者MapReduce讀寫Orc文件。 本文先介紹使用Java API讀取Hive Orc文件。 在Hive中已有一張Orc格式存儲的表lxw1234: 該表有四個字段:url、word、freq、w
相關文章
相關標籤/搜索