透徹理解高斯分佈

正態分佈是與中的定量現象的一個方便模型。各類各樣的心理學測試分數和現象好比計數都被發現近似地服從正態分佈。函數

開始前,先看幾個重要概念:測試

機率函數:把事件機率表示成關於事件變量的函數spa

機率分佈函數:一個隨機變量ξ取值小於某一數值x的機率,這機率是x的函數,稱這種函數爲隨機變量ξ的分佈函數,簡稱分佈函數,記做F(x),即F(x)=P(ξ<x) (-∞<x<+∞),由它並能夠決定隨機變量落入任何範圍內的機率。blog

機率密度函數:機率密度等於變量在一個區間(事件的取值範圍)的總的機率除以該段區間的長度。事件

機率密度函數是一個描述隨機變量在某個肯定的取值點附近的可能性的函數。class

機率分佈函數與機率密度函數的關係:變量

連續型隨機變量X的機率分佈函數F(x),若是存在非負可積函數f(x),使得對任意實數x,有im

 

f(x)爲X的機率密度d3

高斯分佈統計

經過幾率密度函數來定義高斯分佈:

 

高斯分佈的機率密度函數是:

 

均值爲μ,標準差爲σ

 

高斯分佈的機率分佈函數是:

 

高斯分佈標準差在機率密度分佈的數據意義

 

 

高斯分佈重要量的性質

密度函數關於平均值對稱平均值是它的衆數(statistical mode)以及中位數(median)函數曲線下68.268949%的面積在平均值左右的一個標準差範圍內95.449974%的面積在平均值左右兩個標準差2σ的範圍內99.730020%的面積在平均值左右三個標準差3σ的範圍其中第3-5條稱爲68-95-99.7法則

舉一個例子:

檢查一些示例數據:

女性體重的平均值= 127.8

標準誤差(SD)= 15.5

一個標準差的範圍

兩個標準差的範圍

 

如何檢查你的數據是否是高斯分佈

· 看直方圖! 是否是看起來像鐘形?

· 計算描述性彙總度量 - 平均值,中位數和模式是否類似?

· 2/3的觀察是否位於平均值的±標準差1內? 95%的觀察值是否在平均值的±2標準差範圍內?

中心極限定理

正態分佈有一個很重要的性質:在特定條件下,大量統計獨立的隨機變量的和的分佈趨於正態分佈,這就是中心極限定理。中心極限定理的重要意義在於,依據這必定理的結論,其它機率分佈可以用正態分佈做爲近似。

高斯分佈能夠從二項式(或泊松)推導出假設:

p不接近1或者0時,n很是大

咱們有一個連續變量而不是一個離散變量

考慮扔一次硬幣10,000次。

p(頭)= 0.5,N = 10,000

對於二項分佈:

平均數爲μ = np=5000,標準差爲σ = [np(1 p)] 1/2=50。

此二項分佈的機率在μ±1範圍內:

 

高斯分佈均值±一個標準差的機率積分:

 

高斯分佈線性組合的重要性質

 

相關文章
相關標籤/搜索