記一次Phoenix寫入優化

場景描述 現有大量CSV格式的數據記錄存儲在HDFS中,需要批量索引到Hbase以便於數據查詢。限於Hbase的主鍵索引以及使用Hbase API的諸多不方便,最後採用了Phoenix+Hbase的技術架構。基於此方案數據的索引可通過Phoenix的SQL API、Spark RDD插件、以及Phoenix提供的批量加載工具」 CsvBulkLoadTool」來實現數據寫入,由於HDFS原始數據和
相關文章
相關標籤/搜索