大數據學習筆記(spark日誌分析案例)

前提:500w條記錄環境下(可以更多,視計算機性能而定),統計每天最熱門的top3板塊。 1、PV和UV 我們要統計的是最熱門的top3板塊,而熱門如果只是簡單地通過頁面瀏覽量(PV)或者用戶瀏覽量(UV)來決定都顯得比較片面,這裏我們綜合這兩者(0.3PV+0.7UV)來獲取我們的需求。 1.1、PV PageView:瀏覽量。(有幾次瀏覽就算幾次)    1.2、UV UserView:用戶量
相關文章
相關標籤/搜索