Spark SQL讀取HBase中數據的優化

時間 2020-05-15

標籤 spark sql 讀取 hbase 數據優化欄目 Spark 简体版

原文原文鏈接

在項目過程當中中，咱們會常常使用Spark SQL去查詢/分析HBase中的數據，內置的讀取數據源使用的是TableInputFormat ，這個TableInputFormat 有一些缺點：sql 一個Task裏面只能啓動一個Scan取HBase中讀取數據； TableInputFormat 中不支持BulkGet 不能享受到Spark SQL內置的catalyst引擎的優化

>>阅读原文<<