基於正態分佈的前端性能數據分析(一)

原文 基於正態分佈的前端性能數據分析(一)前端

前言

公司的前端項目是上報了各項性能數據的,如首屏時間、onload時間、網絡用時等;因爲用戶可能處於各種環境中,如不一樣的網絡環境、機型差別、同一手機的不一樣運行狀態等,致使性能數據會有較大的波動,而這些異常數據對平均值的影響是很是大的,所以不能簡單地用平均值描述性能情況,而應該作更加深刻地分析數據。
經過對性能數據的統計分析,咱們但願獲得性能數據的分佈狀況,監控上線先後的性能變化,甚至運行期間的性能波動,分析緣由出在哪一個環節,從而有針對性地優化項目;而且針對每一次優化,咱們可以定量地肯定優化成效有多大,而不是「嗯,好像優化有效果,在個人電腦上都變快了」
ps:因爲不是專業作數據分析的,分析過程若是有不合理的地方,歡迎指正。segmentfault

探索

因爲咱們主要關注用戶的首屏時間,所以我這裏拿到了一週內首屏數據的抽樣結果(約13萬條),爲了瞭解首屏時間的分佈狀況,我以50ms爲間距統計各個時間段內的數據量,繪製折線圖結果以下:網絡

clipboard.png

能夠看到數據分佈比較對稱,曲線呈鐘形,數據主要集中在550ms附近。
在傳統的統計分析當中,不少時候咱們都但願用正態分佈來分析數據,就算不符合正態分佈的數據,也有可能將原始數據轉換爲正態數據。
從上圖能夠看到,咱們的數據是比較符合正態分佈的特徵的,所以咱們能夠嘗試使用正態分佈來分析。
因爲segmentfault對數學公式支持不太友好,剩餘內容請參考原文前端性能

相關文章
相關標籤/搜索