[toc]html
最近在學習統計學相關的知識,在閱讀《Head First 統計學》的過程當中,遇到了標準差這個概念,當時理解的不是很透徹,就這樣略過閱讀下面的章節。學習
直到最近在學習PMP過程當中看到了楊述老師對標準差概念的講解,雖然簡單,可是使我對標準差的理解一會兒就提高了一大半,所以在這裏我試着記錄下來,一來鞏固理解,二來測試一下本身是否真的理解到位了,畢竟,只有說的明白,纔算是真的理解。測試
籃球教練在招收球員入隊的時候,須要有一系列的指標做爲入隊標準;當兩個球員的身體素質等都差很少的時候,就很難抉擇該選擇誰入隊,這時候標準差就是一個很是好的參考;spa
一樣,咱們在作兩個球星的差距的時候,標準差就能很是有效的描述差距的大小。htm
西格瑪標準差實際上是衡量數據或機率分佈的曲線的胖瘦。blog
西格瑪小的表示機率穩定。例如這裏科比的$\sigma=3.7$表示他每場得30分的機率很是穩定,換句換說,不管觀衆和隊友,只要科比一上車,打錯了,一上場,你們內心都有數,這30分是基本到手了。get
可是若是一樣在NBA打球的易建聯 $\sigma=9.2$的上車,狀況就不那麼穩定了,運氣好也能拿30分,運氣很差可能拿幾分都有。因此水平高低從標準差上一目瞭然。io
標準差是描述數據或機率分佈的集中程度。標準差大小,數據/機率都離這個指望值不遠;反之,若是標準差大則表示數據/機率離指望值很遠,什麼都有可能發生。im
舉一個極端不穩定的狀況,一個球員上場要麼得60分,要麼得0分,那麼均值看起來是30分,和科比同樣高呢。可是這樣的球員你敢在總決賽那天送他上場嗎?你送他上場,他送你上天。統計
所以均值顯然沒有體現事情的所有真像,你正在須要知道的是變化幅度(Variance)。均值給出了平均數,而標準差給出了分散程度。
不必定,若是你是找出每場發揮穩定的球員,標準差小就是你要找的人;或者是你正在生存機器零件,標準差小那麼零件越一致。
若是你準備入職一家新公司準備大幹一場,若是這家公司工資的標準差很小,表示你大幹一場或者不幹都差很少,你也許應該找一家標準差大的公司大幹一場。
標準差的平方就是方差。因爲在統計帶有負號的數據的時候,若是不用平方最後求出來的標準差可能爲0,所以才產生了方差。具體二者關係能夠參考《Head First 統計》
就是方差的根號:
其中:x表示一組數據集內的每個數據,u表示這組數據集的均值, n表示數據集內的個數。
又能夠簡化成: