運營商流量運營:java
分析用戶上網行爲數據,內容分析,用戶畫像,終端分析,網絡系統監控,上網詳單查詢..服務器
如何作?網絡
1.數據採集:spa
從經分數據、信令網關(用戶每一次請求的詳細信息)獲取數據到ftp服務器日誌
咱們的服務器去對接採集,相似flume(flume的使用)監控
java採集系統:ftp
1.健壯性:別人的服務器掛了不能致使咱們的服務器掛了;終端
2.實時性:採集速度比生成速度快;請求
3.可靠性:採集的數據能正確傳遞;數據採集
上傳數據,對數據進行分類
分類合併上傳,在本地磁盤中採集的數據不進行合併,當上傳到hdfs上在進行合併,減小本地磁盤的讀寫操做,可是hdfs上合併,比較複雜,可靠性低,上傳hdfs上要在本地記錄日誌,把出錯的文件那一部分重傳一下,