第一章 初識實時流處理

一. 業務現狀分析 1.需求 統計某視頻學習平臺主站上每個(指定)課程訪問的客戶端(PC/APP)、地域信息分佈。 用戶每一次在站點上發生點擊或搜索是都會產生日誌,如何從這個日誌裏面提取出來這些地域和終端信息呢? 地域信息:由IP進行轉換; 客戶端:通過useragent獲取 以上兩個操作都是可以採用離線的方式(Spark/MapReduce)進行統計的。 2.實現步驟 提取出課程編號(URL)、
相關文章
相關標籤/搜索