第五週:統計量與抽樣分佈

統計量

統計量是統計理論中用來對數據進行分析、檢驗的變量。宏觀量是大量微觀量的統計平均值,具備統計平均的意義,對於單個微觀粒子,宏觀量是沒有意義的.函數

相對於微觀量的統計平均性質的宏觀量也叫統計量。須要指出的是,描寫宏觀世界的物理量例如速度、動能等實際上也能夠說是宏觀量,但宏觀量並不都具備統計平均的性質,於是宏觀量並不都是統計量。url

樣本均值

樣本均值(sample mean)又叫樣本均數。即爲樣本的均值。spa

均值是表示一組數據集中趨勢的量數,是指在一組數據中全部數據之和再除以這組數據的個數。它是反映數據集中趨勢的一項指標。.net

樣本均值則是在整體中的樣本數據的均值。3d

 

樣本:blog

樣本(sample),是指從整體中抽出的一部分個體。樣本中所包含個體數目稱樣本容量或含量,用符號N或n表示。get

均值:數學

均值是表示一組數據集中趨勢的量數,是指在一組數據中全部數據之和再除以這組數據的個數。它是反映數據集中趨勢的一項指標。it

解答平均數應用題的關鍵在於肯定「總數量」以及和總數量對應的總份數。在統計工做中,平均數(均值)和標準差是描述數據資料集中趨勢和離散程度的兩個最重要的測度值。io

 
設  是來自正態整體   的樣本,  是樣本均值,則有  :

樣本方差

先求出 整體各單位變量值與其 算術平均數離差的平方,而後再對此變量取 平均數,就叫作  樣本方差
樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即爲樣本的均值。均值是指在一組數據中全部數據之和再除以數據的個數。

 

樣本方差的公式爲   其中   爲樣本均值

樣本變異係數

樣本變異係數是樣本標準差與樣本均值之比,是在消除量綱影響後的樣本分散程度的一種度量。
樣本變異係數,有時也稱之爲相對標準差,記爲Cv。  

樣本K階矩

樣原本自整體,攜帶了整體的部分信息。進行統計分析和推斷時,要使用樣本攜帶的信息推斷整體的機率性質,但樣本帶來的信息每每是分散凌亂的,須要集中整理加工後才便於利用。

初步整理能夠用分組、做圖、列表等方法,但進一步深刻統計提取樣本信息就要根據問題的須要構造樣本函數——統計量。

設   爲來自整體的樣本,若樣本的   元函數    是一個連續卻不含整體未知參數的函數,則稱其爲統計量 

 

有一類經常使用的統計量是樣本的數字特徵,他們是模擬整體數字特徵構造的,稱爲樣本矩(這裏只列出樣本k階原點鉅、樣本k階中心鉅):

 
樣本    階 原點矩: 
樣本    階 中心距: 

樣本偏度

樣本偏度(sample skewness)一種基本統計量.樣本三階中心矩除以樣本二階中心矩的3/2次冪的商,記爲Sk。

偏度定義中包括正態分佈(偏度=0),右偏分佈(也叫正偏分佈,其偏度>0),左偏分佈(也叫負偏分佈,其偏度<0)。

 

樣本峯度

樣本峯度(sample kurtosis)一種基本統計量,樣本的峯度和偏度都是做爲檢驗整體分佈正態性的統計量。
 
樣本四階中心矩除以樣本二階中心矩平方的商再減去3,記爲Ku,樣本峯度經常使用以做整體峯度的估計量.
正態分佈的峯度爲零.非正態分佈的峯度是以正態分佈的峯度爲標準來描述其分佈密度形狀爲陡峭或平坦的一個數字特徵.

抽樣分佈

卡方分佈

卡方分佈 (χ2分佈)是機率論統計學中經常使用的一種機率分佈

k 個獨立的標準正態分佈變量的平方和服從自由度爲k 的卡方分佈。卡方分佈經常使用於假設檢驗置信區間的計算。

數學定義:

若k 個隨機變量Z一、……、Zk 相互獨立,且數學指望爲0、方差爲 1(即服從標準正態分佈),則隨機變量X X=\sum_{n=1}^k Z_n^2 被稱爲服從自由度爲 k 的卡方分佈

記做: X\ \sim\ \chi^2(k)

具體點擊查看:卡方分佈

T分佈

機率論統計學中,t-分佈(t-distribution)用於根據小樣原本估計呈正態分佈且方差未知的整體的均值。

若是整體方差已知(例如在樣本數量足夠多時),則應該用正態分佈來估計整體均值。

 

t分佈曲線形態與n(確切地說與自由度df)大小有關。與標準正態分佈曲線相比,自由度df越小,t分佈曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高;

自由度df愈大,t分佈曲線愈接近正態分佈曲線,當自由度df=∞時,t分佈曲線爲標準正態分佈曲線。

 

因爲在實際工做中,每每σ是未知的,經常使用s做爲σ的估計值,爲了與u變換區別,稱爲t變換,統計量t 值的分佈稱爲t分佈。  [1] 
 
假設X服從標準正態分佈N(0,1),Y服從    分佈,那麼      的分佈稱爲自由度爲n的t分佈,記爲   。
 
分佈密度函數:      , 其中,Gam(x)爲伽馬函數。
具體參考: t分佈

F分佈

F分佈是1924年英國統計學家R.A.Fisher提出,並以其姓氏的第一個字母命名的。

它是一種非對稱分佈,有兩個自由度,且位置不可互換。F分佈有着普遍的應用,如在方差分析、迴歸方程的顯著性檢驗中都有着重要的地位。

具體見:F分佈

樣本方差的分佈

樣本比例的抽樣分佈

中心極限定理

心極限定理是機率論中最著名的結果之一,它提出,大量的獨立隨機變量之和具備近似於正態的分佈。

兩個樣本平均值之差的分佈

設  是來自正態分佈  的一個樣本, 是來自正態分佈  的一個樣本,且  與  相互獨立,則:

,其中  是第一自由度(分子自由度)爲 n11,第二自由度(分母自由度)爲 n21 的 F分佈。

相關文章
相關標籤/搜索