大數據之BI開發 - 維度建立

      用多維數據庫中的點,表示對業務的度量結果。在各類各樣的市場銷售產品,並不斷對企業各種業務的表現進行度量。數據庫

 

術語彙總結合圖ide

 

 

 

相關概念工具

 

  • 事實(表示某個業務度量)表:用於度量

存儲組織機構業務過程事件的性能度量結果;每一行數據是一個特定級別的細節數據 ;事實表的主鍵,是外鍵集合(組合鍵) 。性能

 

  • 維度表:用於描述環境

一般有多列,或者說多個屬性 。用於描述與「誰、什麼時候、哪裏、爲何、如何、什麼」有關的事件 大數據

 

  • 事實表與維度表的鏈接,遵循簡單和對稱性。

 

 

  • 星型模型與雪花模型:根據事實表和維度表的關係
    • 星型模型:

 

    • 雪花模型:

 

 

參考:spa

  • 大數據查詢系統:Hive、Impala、Spark  SQL、Kylin
  • 查詢速度與被查詢數據總量之間的關係:給定硬件條件下,假設數據總量爲N( 1)查詢時間隨着數據量的增加而線性增加,O(N) ;2)查詢時間不隨數據量增加而增加,O(1) )
  • 大數據查詢相關的關鍵技術:列式存儲;並行計算;內存計算
  • SQL SERVER中ETL工具 - AS:項目中的Cube  https://v.kuaishou.com/bdZ6cy

相關文章
相關標籤/搜索