數據如何流轉的?
提示:架構圖
複製代碼
爲何要進行分層?分了哪幾層?每層的做用是什麼?
表如何分類?分別使用什麼同步方案?具體如何實現同步?
提示:實體表、維度表、事務事實表、週期事實表,全量、增量、更新+新增
複製代碼
數據庫設計三範式是什麼?
提示: 列不能再分,不存在部分依賴和傳遞依賴
複製代碼
數據倉庫OLAP使用哪一種建模方案?業務數據庫OLTP使用哪一種建模方案?
提示:關係建模 VS 維度建模
複製代碼
維度建模有幾種常見模型?
提示:星型模型、雪花模型、星座模型
複製代碼
業務數據庫如何導入?導入哪一種格式?
提示:sqoop,text,能夠支持orc,sqoop參數
複製代碼
爲何要進行維度退化?如何進行維度退化?
提示:減小Join
複製代碼
用戶行爲指標有哪些?如何計算?
提示:活躍、新增、留存、流失、迴流、沉默、連續活躍
複製代碼
GMV指標是什麼?如何計算?
轉化率指標是什麼?如何計算?
漏斗模型是什麼?如何計算?
品牌復購率是什麼?如何計算?
拉鍊表是什麼?如何生成?
提示:經過關係型數據庫的create time和update time獲取數據的新增和變化,用臨時表解決了Hive中數據不能更新的問題。複製代碼