本文首發於知乎 《阿里UC百億級PV的前端監控平臺實踐》 ,搬運轉載請註明出處,不然追究版權責任。javascript
阿里UC百億PV的嶽鷹全景監控平臺實踐 系列文章:html
Web承載的業務愈來愈複雜,用戶對於Web的體驗要求也愈來愈高,Web性能的優劣對業務收益也有着很是直接的影響。前端
本文主要介紹阿里UC百億級PV前端監控平臺, 嶽鷹全景監控平臺 的實踐歷程 - 大數據分析,閱讀時長 5 分鐘。java
獲取到數據僅僅是第一步,一個極致的監控系統須要沉澱有效的分析方法,幫忙開發者高效的定位和解決問題。git
基於Elasticsearch存儲的日誌,能夠很是方便的聚合各類維度報表;在海量數據的場景下,還能夠引入Spark Streaming等實時計算引擎達到「1分鐘實時分析」,更快速的發現問題,把問題影響面控制到最小。github
這裏介紹的更可能是咱們如何經過自動的聚類和維度統計,提供一套高效的監控分析手段。web
對於數據分析,咱們分爲大盤分析和單用戶分析,大盤分析指的是經過各個維度快速識別 規模性的問題,而單用戶分析則是分析 單點問題的利器。小程序
時間維度微信小程序
按照時間線的粒度,一般能夠分爲 分鐘級別、小時級別、天級別的統計。微信
對於異常問題,分鐘級別的時間粒度統計,能夠在問題發生的第一時間通知到開發者;
而對於性能這種週期指標,經過小時和天級別的時間粒度統計,能夠觀察更長時間的變化趨勢。
運行環境維度
前端頁面的運行環境,例如網絡類型、運營商、地域,操做系統,設備機型信息等。
爲何運行環境維度的分析也這麼重要?頁面加載的大量靜態資源和AJAX請求都須要通過網絡運營商、CDN廠商,劫持、網絡/CDN抖動、資源404等狀況比比皆是。
細粒度的代碼追蹤
JS異常的代碼棧頂信息,定位到發生異常的代碼位置和異常堆棧;API請求異常的響應錯誤碼和響應內容,定位到具體的API錯誤類型和緣由。毫無疑問這是開發者解決問題是最須要等信息了。
單用戶分析
一個異常是怎麼發生的,須要將異常操做的先後時間線串聯起來觀察。它不僅僅涉及一次用戶操做,甚至不限於某一個頁面,而是一連串事件的表現。
經過將用戶訪問過程的異常和請求日誌鏈接起來,造成用戶訪問頁面的時序,以動態的效果輸出發生異常的過程;而且能夠把業務的關鍵節點也關聯起來,例如頁面的點擊操做等。
這樣能夠提供很是詳細的現場還原效果,在解決具體用戶遇到的錯誤時很是有效。
阿里UC出品的 嶽鷹全景監控平臺 ,支持移動H五、PC站點、微信小程序以及支付寶小程序等各家小程序,PV、JS異常、頁面性能等監控指標完整,已經對外開放,歡迎免費體驗試用。
技術交流、第一時間掌握產品動態,歡迎聯繫微信小助手~