單表千億電信大數據場景,使用Spark+CarbonData替換Impala案例

背景介紹 國內某移動局點使用Impala組件處理電信業務詳單,每天處理約100TB左右詳單,詳單表記錄每天大於百億級別,在使用impala過程中存在以下問題: 1、詳單採用Parquet格式存儲,數據表使用時間+MSISDN號碼做分區,使用Impala查詢,利用不上分區的查詢場景,則查詢性能比較差。 2、在使用Impala過程中,遇到很多性能問題(比如catalog元數據膨脹導致元數據同步慢等),
相關文章
相關標籤/搜索