單表千億電信大數據場景，使用Spark+CarbonData替換Impala案例

時間 2021-07-13

原文原文鏈接

背景介紹國內某移動局點使用Impala組件處理電信業務詳單，每天處理約100TB左右詳單，詳單表記錄每天大於百億級別，在使用impala過程中存在以下問題: 1、詳單採用Parquet格式存儲，數據表使用時間+MSISDN號碼做分區，使用Impala查詢，利用不上分區的查詢場景，則查詢性能比較差。 2、在使用Impala過程中，遇到很多性能問題(比如catalog元數據膨脹導致元數據同步慢等)，

>>阅读原文<<