數據倉庫

數據如何流轉的?

提示:架構圖
複製代碼

爲何要進行分層?分了哪幾層?每層的做用是什麼?

表如何分類?分別使用什麼同步方案?具體如何實現同步?

提示:實體表、維度表、事務事實表、週期事實表,全量、增量、更新+新增
複製代碼

數據庫設計三範式是什麼?

提示: 列不能再分,不存在部分依賴和傳遞依賴
複製代碼

數據倉庫OLAP使用哪一種建模方案?業務數據庫OLTP使用哪一種建模方案?

提示:關係建模 VS 維度建模
複製代碼

維度建模有幾種常見模型?

提示:星型模型、雪花模型、星座模型
複製代碼

業務數據庫如何導入?導入哪一種格式?

提示:sqoop,text,能夠支持orc,sqoop參數
複製代碼

爲何要進行維度退化?如何進行維度退化?

提示:減小Join
複製代碼

用戶行爲指標有哪些?如何計算?

提示:活躍、新增、留存、流失、迴流、沉默、連續活躍
複製代碼

GMV指標是什麼?如何計算?

轉化率指標是什麼?如何計算?

漏斗模型是什麼?如何計算?

品牌復購率是什麼?如何計算?

拉鍊表是什麼?如何生成?

提示:經過關係型數據庫的create time和update time獲取數據的新增和變化,用臨時表解決了Hive中數據不能更新的問題。複製代碼
相關文章
相關標籤/搜索