Evernote Export
參數估計與假設檢驗是統計推斷的兩個組成部分,都是利用樣本信息對整體進行推斷,可是角度不一樣。
參數估計是樣本統計量估計整體參數的方法,整體參數在估計前是未知的。
假設檢驗是先對整體參數提出一個假設,後用樣本信息去驗證這個假設是否正確。
參數估計不知道整體的信息,也不進行假定,假設不知道整體,須要驗證信息。spa
1.假設檢驗的基本思想和原理
2.假設檢驗的步驟
3.一個整體參數的檢驗
4.兩個整體參數的檢驗
5.P值的計算與應用
6.用EXCEL進行檢驗orm
1.假設問題的提出
2.假設的表達式
3.兩類錯誤
4.假設檢驗的流程
5.利用P值進行決策xml
什麼是假設?
對整體參數的具體數值所作的陳述
-整體參數包括整體均值、比例、方差等
-分析以前必需陳述事件
什麼是假設檢驗
1.先對整體的參數(或分佈形式)提出某種假設,而後利用樣本信息判斷假設是否成立的過程
2.有參數檢驗和非參數檢驗
3.邏輯上運用反證法,統計上依據小几率原理ci
原假設
1.研究者想收集證據予以反對的假設
2.又稱爲"0假設"
3.老是有符號=,≤或≥
4.表示爲H0
H0:\mu=某一數值
指定爲符號=,≤或≥
例如 H0:μ=10cm
通常狀況下,記原假設爲H0所謂爲零假設
備擇假設
1.研究者想收集證據予以支持的假設
2.也稱爲研究假設
3.老是有符號 !=,≤或≥
4.表示爲H1
H1:μ<某一數值,或μ>某一數值
例如:H1:μ<10cm,或mu>10cm
原假設和備擇假設是屬於非此即彼的關係,通常來講,原假設是包含等於的
提出假設
1.原假設和備擇假設是一個完備事件組,並且相互獨立
在一項假設檢驗中,原假設和備擇假設必有一個條件成立,並且只有一個成立
2.先肯定備擇假設,再肯定原假設
3.等號=老是放在原假設上
4.因研究目的不一樣,對同一問題可能提出不一樣的假設(也可能得出不一樣的結論)
雙側檢驗和單側檢驗
1.備擇假設沒有特定的方向性,並含有符號≠的假設檢驗,稱爲雙側檢驗或雙尾檢驗
2.備擇假設具備特定的方向性,並含有符號≤和\req的假設檢驗,稱爲單側檢驗或單尾檢驗it
- 備擇假設的方向爲<,稱爲左側檢驗
- 備擇假設的方向爲>,稱爲右側檢驗
假設 | 雙側檢驗 | 單側檢驗(左側) | 單側檢驗(右側) |
---|---|---|---|
原假設 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
備擇假設 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
- 1.第I類錯誤(棄真錯誤)
- 原假設爲真,拒絕原假設
第I類錯誤的機率記爲α,被稱爲顯著性水平
2.第II類錯誤(取僞錯誤)- 原假設爲假設時未拒絕原假設
- 第II類錯誤的機率記爲β
兩類錯誤時此消彼長的關係,不可能同時達到平衡,須要有所取捨
影響beta錯誤的因素io
- 1.整體參數的真值
- 隨着假設的整體參數的減小而增大
2.顯著性水平α
當α減小時增大
3.整體標準差
當α增大時增大
4.樣本容量n
當n減小時增大
顯著性水平α
1.是一個機率值
2.原假設爲真時,拒絕原假設的機率被稱爲抽樣分佈的拒絕域
表示爲αtable
- 經常使用的α有0.01,0.05,0.1
由研究者提出
假設檢驗中的小几率原理
什麼是小几率?
1.在一次試驗中,一個幾乎不可能發生的事件發生的機率
2.在一次試驗中小几率事件一旦發生,就有理由拒絕原假設
3.小几率由研究者事先肯定ast
檢驗統計量
1.根據樣本觀測結果計算獲得的,並據以對原假設和備擇假設做出決策的某個樣本統計量
2.對樣本估計量的標準化結果
- 原假設H0爲真
- 點估計量的抽樣分佈
3.標準化的檢驗統計量
標準化檢驗統計量 ={點估計量-假設值}/{點估計量的抽樣標準差}
決策規則
1.給定顯著性水平區間下,查表的出相應的臨界值z或z2α,tm或t2α
2.將檢驗統計量的值與顯著性水平的臨界值進行比較
3.作出決策
- 雙側檢驗 統計量>臨界值,拒絕H0
- 左側檢驗 統計量<- 臨界值,拒絕H0
- 右側檢驗 統計量>臨界值,拒絕H0
什麼是P值
1.在原假設爲真的條件下,檢驗統計量的觀察值大於或等於其計算值的機率
- 雙側檢驗爲分佈中兩側面積的總和
2.反映實際觀測到的數據與原假設H0之間不一致的程度
3.被稱爲觀察到的(或實測的)顯著性水平
3.決策規則 若P值<α,拒絕原假設
1.假設檢驗的目的在於試圖找到拒絕原假設,而不在於證實什麼是正確的
2.拒絕原假設時結論是清楚的
- 例如 H0:μ=10,拒絕H0時,能夠說μ≠10
3.當不拒絕原假設時,
- 並未給出明確的結論
- 不能說原假設是正確的,也不能說它不是正確的
- 例如,當不拒絕H0:μ=10,並未說它就是10,但也未說它不是10.只能說樣本提供的證據不足以推翻原假設。
1.陳述原假設和備擇假設
2.從研究的整體中抽出一個隨機樣本
3.肯定一個適當的檢驗統計量,並利用樣本統計依據算出具體數值
4.肯定一個適當的顯著性水平,並計算出其臨界值,指定拒絕域
5.將統計量的值域臨界值進行比較,作出決策
- 統計量的值落在拒絕域,拒絕H0,不然不拒絕H0
- 也能夠直接利用P值作出決策
檢驗統計量的肯定
整體均值的檢驗
整體比例的檢驗
整體方差的檢驗
1.假定條件
正態整體或非正態整體大樣本n ≥ 30
2.使用z檢驗統計量
α2 已知 z=nσx−μ0 N(0,1)
α2 未知 z=nsx−μ0 N(0,1)
假設 | 雙側檢驗 | 左側檢驗 | 右側檢驗 |
---|---|---|---|
假設形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假設形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
統計量 | α已知 | z=nσx−μ0 | |
統計量 | α未知 | z=nsx−μ0 | |
拒絕域 | z>z2α | z<−zα | z>zα |
P值決策 | P<α 拒絕H0 |
1.假定條件
- 整體服從正態分佈
- 小樣本(n<30)
2.檢驗統計量
α2已知 z=nσx−μ0~N(0,1)
α2未知 z=nsx−μ0~t(0,1)
假設 | 雙側檢驗 | 左側檢驗 | 右側檢驗 |
---|---|---|---|
假設形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假設形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
統計量 | α已知 | z=nσx−μ0 | |
統計量 | α未知 | z=nsx−μ0 | |
拒絕域 | t>t2α(n−1) | t<−tα(n−1) | t>tα(n−1) |
P值決策 | P<α 拒絕H0 |
假定條件
- 整體服從二項分佈
- 可用正態分佈來近似(大樣本)
檢驗的z統計量
z=npi0(1−π0)p−π0
pi0爲假設的整體比例
假設 | 雙側檢驗 | 左側檢驗 | 右側檢驗 |
---|---|---|---|
假設形式 | H0:μ=μ0 | H0:μ≥μ0 | H0:μ≤μ0 |
假設形式 | H1:μ≠μ0 | H1:μ<μ0 | H1:μ>μ0 |
統計量 | z=nπ0(1−π0)p−π0 | ||
統計量 | |||
拒絕域 | z>z2α | z<−aα | z>zα |
P值決策 | P<α 拒絕H0 |
整體方差是服從卡方分佈的,檢驗一個整體的方差或標準差,假設整體近似服從正態分佈,使用χ2
檢驗統計量
χ2=σ02(n−1)s2~χ2(n−1)
其中s爲樣本方差,σ爲假設整體方差
兩個統計量的肯定
兩個整體均值之差的檢驗
兩個整體比例之差的檢驗
兩個整體方差之比的檢驗
檢驗中的匹配樣本
1.假定條件
- 兩個樣本是獨立的隨機樣本
- 正態整體或非正態整體大樣本(n_1 \geq 30 n_2 \req 30)檢驗統計量
σ12,σ22已知z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
σ12,σ22未知z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
1.假定條件
- 兩個獨立的小樣本
- 兩個整體都是正態分佈
σ12、σ22已知
檢驗統計量
z=n1σ12+n2σ22(x1−x2−(μ1−μ2))~N(0,1)
\sigma_1^2,\sigma_2^2未知可是\sigma_1^2=\sigma_2^2$$
1.假定條件
- 兩個獨立的小樣本
- 兩個整體都是正態分佈
- σ12、σ22未知可是相等,即σ12=σ22
2.檢驗統計量
t=spn11+n21(x1−x2)−(μ1−μ2)
其中sp2=n1+n2−2(n1−1)s12+(n2−1)s22
σ12,σ22未知且不相等σ12≠σ22
假定條件
- 兩個整體都是正態分佈
- σ22,σ22未知且不相等,即σ12≠σ22
- 樣本容量不相等,即n1≠n2
檢驗統計量
t=n1s12+n2s22(x1−x2)−(μ1−μ2)
自由度 v=n1−1n22s12+n2−1n2s22(n1s12+n2s22)
假定條件
兩個整體配對差值構成的整體服從配對差是由差值整體中隨機抽取的數據配對或匹配(重複測量(前/後))
檢驗統計量
t=ndSdd−d0~t(n−1)
樣本差值均值d=nd∑i=1ndi
假定條件
兩個整體都服從二項分佈
能夠用正態分佈來近似檢驗統計量
檢驗H0,π1−π2=0,z=p(1−p)(n11+n21)p1−p2
檢驗H0,π1−π2=d0,z=n1p1(1−p1)+n2p2(1−p2)(p1−p2)−d0