數據倉庫概念

1、項目需求java

  • 數據採集平臺搭建
  • 實現用戶行爲數據倉庫的分層搭建
  • 實現業務數據倉庫的分層搭建
  • 針對數據倉庫中的數據進行留存、轉換率、GMV、復購率、活躍等報表分析

2、思考題sql

  • 項目技術如何選型
  • 框架版本如何選型(如Apache、CDH、HDP)
  • 服務器使用物理機仍是雲主機
  • 如何確認集羣規模?(假設每臺服務器8t硬盤)

技術選型:api

數據採集傳輸Flume、Kafka、Sqoop、Logstash、 DataX服務器

數據存儲Mysql、HDFS、HBase、Redis、MongoDB框架

數據計算Hive、Tez、Spark、Flink、Stormoop

數據查詢Presto、Druid、Impala、Kylinui

 

問題:spa

kafka消息存HDFS方法?設計

java代碼消費,而後調用HDFS上傳api或者經過Flumerest

 

系統數據流程設計

相關文章
相關標籤/搜索