hadoop日誌數據分析開發步驟及代碼

日誌數據分析: 1.背景 1.1 hm論壇日誌,數據分爲兩部分組成,原來是一個大文件,是56GB;以後每天生成一個文件,大約是150-200MB之間; 1.2 日誌格式是apache common日誌格式;每行記錄有5部分組成:訪問ip、訪問時間、訪問資源、訪問狀態、本次流量;27.19.74.143 - - [30/May/2013:17:38:20 +0800] "GET /static/im
相關文章
相關標籤/搜索