《分佈式數據倉庫最佳實踐》學員答疑實錄(2)

1、前言

本文是《***分佈式數據倉庫最佳實踐***》視頻課程的學員答疑實錄,學員答疑過程當中,針對共性問題和具備表明性的問題,分享在此,算是立此存照。課程大綱見:《分佈式數據倉庫最佳實踐-目錄篇》,課程地址:網易雲課堂性能優化

2、正文

2.1 問題類型:

事實表設計:累積事實表,是否須要拆分紅不一樣的事實表。app

2.2 問題描述

**關鍵詞:**業務系統中的累積事實表,數倉中是否須要拆分紅不一樣的事實表;分佈式

詳情:
胖哥,你好,想問下若是業務系統的表是一張累積事實表(交易可能有多個過程,加入購物車、下單、支付、評論,可是業務系統是一張大表),在數倉的時候須要將其拆分紅多張事務事實表嗎?性能

2.3 胖哥觀點

關鍵詞:須要;
詳情
學員 2019/2/20 14:33:40
目前是將其拆分
便於統計,可是發現由於不少維度都是相同的,除了存儲多些,其餘到時沒有影響
胖子哥 2019/2/20 14:34:26
這裏面有一個判斷標準:數倉是面向分析過程的,提供的是儘量多的場景的覆蓋。
學員 2019/2/20 14:34:40
好的
胖子哥 2019/2/20 14:34:41
這裏面涉及另一個問題,性能優化
學員 2019/2/20 14:34:58
分紅多個事實表對於後面匯聚是容易的
胖子哥 2019/2/20 14:35:40
因此。1.最細粒度,必須拆分;2.從性能優化的視角,能夠考慮作融合事實表(一般叫寬表);兩者同時存在。
1.是基礎,覆蓋分析型的場景和需求;2.是特定目的的特定應用
學員 2019/2/20 14:37:23
我如今是單事實表和累積事實表並存,累積便於去進行漏斗這樣匯聚
主要是時長漏斗

胖子哥 2019/2/20 14:37:45
能夠。
好多時候,能夠逆推,當你發現本身的設計很差用的時候,就是須要反思設計的時候。
學員 2019/2/20 15:10:47
能夠
胖子哥 2019/2/20 15:11:08
得存檔,不然事後就忘。
學員 2019/2/20 15:14:12
還有個問題,就是建事實表時,事實表除了維度ID,還會退化維度一些關鍵查詢便於識別的屬性,例如產品ID、產品名稱,這種操做可行嗎
胖子哥 2019/2/20 15:14:40
退化維度是合理設計得一部分。
沒問題。優化

3、未完待續

本文是《***分佈式數據倉庫最佳實踐***》視頻課程的學員答疑實錄,學員答疑過程當中,針對共性問題和具備表明性的問題,分享在此,算是立此存照。課程大綱見:《分佈式數據倉庫最佳實踐-目錄篇》,課程地址:網易雲課堂spa

相關文章
相關標籤/搜索