Java API讀取CDH-Hadoop Parquet文件

因爲工做須要,基於目前公司集羣存在較多的服務器且存在大量的內存,所以考慮直接將數據Load進內存進行數據處理,測試是否可以加快處理速度;鑑於以上目的,版主嘗試使用Parquet的Java API讀入Parquet文件。 目前關於使用Java API訪問HDFS的文章較多,可是沒有相關的配置比較容易出錯;同時Java API讀寫Parquet雖然文章較多,但多數爲基於本地文件的讀寫實例。所以,有必要
相關文章
相關標籤/搜索