基於hadoop的網站日誌數據分析

項目目標: 經過網站日誌的分析,計算一些關鍵的指標 歷史數據: 56GB  追加存儲在一個文件夾 數據中的關鍵指標: 瀏覽量pv: 全部用戶瀏覽頁面的總和,一個獨立用戶每打開一個頁面就被記錄一次。此項指標能夠考覈用戶對於網站的興趣。對於網站運營者,更重要的是每一個欄目的瀏覽量。 註冊用戶數: 對方問註冊頁面的用戶數計數 IP數: 一天以內,訪問網站不一樣獨立的ip個數和,一個ip無論訪問了多少次,
相關文章
相關標籤/搜索