大數據項目及實現

1,離線數據處理:項目內容爲經過對網站訪問日誌的採集和清洗,結合數據庫中的結構化用戶數據,統計並展現網站的PV、UV狀況,以對網站的運行狀況進行監控。經過此項目,回顧並串聯前面講述的離線數據處理相關技術,如:FIune、Sqoop、Hive、Spark等,瞭解和掌握PB級數據離線處理的通常過程和架構。算法 2,流式數據處理:項目內容爲經過對數據庫交易數據修改的實時同步,監控網站實時交易狀況,以提升
相關文章
相關標籤/搜索