樣本機率統計

時間 2019-11-10

標籤樣本機率統計简体版

原文原文鏈接

1.ztest-已知,單個正態整體的均值μ的假設檢驗(U檢驗法)

格式：函數

h = ztest(x,m,sigma)% x爲正態整體的樣本,m爲均值μ0,sigma爲標準差,顯著性水平爲0.05(默認值)測試

h = ztest(x,m,sigma,alpha) %顯著性水平爲alphaorm

[h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail) %sig爲觀察值的機率,當sig爲小几率時則對原假設提出質疑,ci爲真正均值μ的1-alpha置信區間,zval爲統計量的值.ci

說明：test

若h=0,表示在顯著性水平alpha下,不能拒絕原假設;變量

若h=1,表示在顯著性水平alpha下,能夠拒絕原假設.隨機數

原假設:方法

tail=0,表示備擇假設:(默認,雙邊檢驗);統計

tail=1,表示備擇假設:(單邊檢驗);數據

tail=-1,表示備擇假設:(單邊檢驗).

例4-74 某車間用一臺包裝機包裝葡萄糖,包得的袋裝糖重是一個隨機變量,它服從正態分佈.當機器正常時,其均值爲0.5公斤,標準差爲0.015.某日開工後檢驗包裝機是否正常,隨機地抽取所包裝的糖9袋,稱得淨重爲(公斤)

0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512

問機器是否正常

解:整體μ和σ已知,該問題是當爲已知時,在水平下,根據樣本值判斷μ=0.5仍是.爲此提出假設:

原假設:

備擇假設:

>> X=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512];

>> [h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0)

結果顯示爲

h =1

sig =0.0248 %樣本觀察值的機率

ci =0.5014 0.5210 %置信區間,均值0.5在此區間以外

zval =2.2444 %統計量的值

結果代表:h=1,說明在水平下,可拒絕原假設,即認爲包裝機工做不正常.

2.ttest-未知,單個正態整體的均值μ的假設檢驗( t檢驗法)

格式

h = ttest(x,m) % x爲正態整體的樣本,m爲均值μ0,顯著性水平爲0.05

h = ttest(x,m,alpha) %alpha爲給定顯著性水平

[h,sig,ci] = ttest(x,m,alpha,tail) %sig爲觀察值的機率,當sig爲小几率時則對原假設提出質疑,ci爲真正均值μ的1-alpha置信區間.

說明：

若h=0,表示在顯著性水平alpha下,不能拒絕原假設;

若h=1,表示在顯著性水平alpha下,能夠拒絕原假設.

原假設:,

tail=0,表示備擇假設:(默認,雙邊檢驗);

tail=1,表示備擇假設:(單邊檢驗);

tail=-1,表示備擇假設:(單邊檢驗).

例4-75 某種電子元件的壽命X(以小時計)服從正態分佈,,σ2均未知.現測得16只元件的壽命以下

159 280 101 212 224 379 179 264 222 362 168 250

149 260 485 170

問是否有理由認爲元件的平均壽命大於225(小時)

解:未知,在水平下檢驗假設

>> X=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170];

>> [h,sig,ci]=ttest(X,225,0.05,1)

結果顯示爲:

h =0

sig =0.2570

ci =198.2321 Inf %均值225在該置信區間內

結果代表:H=0表示在水平下應該接受原假設,即認爲元件的平均壽命不大於225小時.

3.ttest2-兩個正態整體均值差的檢驗(t檢驗)，

兩個正態整體方差未知但等方差時,比較兩正態整體樣本均值的假設檢驗

格式

[h,sig,ci]=ttest2(X,Y) %X,Y爲兩個正態整體的樣本,顯著性水平爲0.05

[h,sig,ci]=ttest2(X,Y,alpha) %alpha爲顯著性水平

[h,sig,ci]=ttest2(X,Y,alpha,tail) %sig爲當原假設爲真時獲得觀察值的機率,當sig爲小几率時則對原假設提出質疑,ci爲真正均值μ的1-alpha置信區間.

說明

若h=0,表示在顯著性水平alpha下,不能拒絕原假設;

若h=1,表示在顯著性水平alpha下,能夠拒絕原假設.

原假設:, (爲X爲指望值,爲Y的指望值)

若 tail=0,表示備擇假設:(默認,雙邊檢驗);

tail=1,表示備擇假設:(單邊檢驗);

tail=-1,表示備擇假設:(單邊檢驗).

例4-76 在平爐上進行一項試驗以肯定改變操做方法的建議是否會增長鋼的產率,試驗是在同一只平爐上進行的.每煉一爐鋼時除操做方法外,其餘條件都儘量作到相同.先用標準方法煉一爐,而後用建議的新方法煉一爐,之後交替進行,各煉10爐,其產率分別爲

(1)標準方法:78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3

(2)新方法: 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1

設這兩個樣本相互獨立,且分別來自正態整體和,,,均未知.問建議的新操做方法可否提升產率 (取α=0.05)

解:兩個整體方差不變時,在水平下檢驗假設::,:

>> X=[78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3];

>>Y=[79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1];

>> [h,sig,ci]=ttest2(X,Y,0.05,-1)

結果顯示爲:

h =1

sig =2.1759e-004 %說明兩個整體均值相等的機率很小

ci =-Inf -1.9083

結果代表:H=1表示在水平下,應該拒絕原假設,即認爲建議的新操做方法提升了產率,所以,比原方法好.

4.ranksum-兩個整體一致性的檢驗——秩和檢驗

格式

p = ranksum(x,y,alpha) %x,y爲兩個整體的樣本,能夠不等長,alpha爲顯著性水平

[p,h] = ranksum(x,y,alpha) % h爲檢驗結果,h=0表示X與Y的整體差異不顯著h=1表示X與Y的整體差異顯著

[p,h,stats] = ranksum(x,y,alpha) %stats中包括:ranksum爲秩和統計量的值以及zval爲過去計算p的正態統計量的值

說明

P爲兩個整體樣本X和Y爲一致的顯著性機率,若P接近於0,則不一致較明顯.

例4-77 某商店爲了肯定向公司A或公司B購買某種商品,將A和B公司以往的各次進貨的次品率進行比較,數據以下所示,設兩樣本獨立.問兩公司的商品的質量有無顯著差別.設兩公司的商品的次品的密度最多隻差一個平移,取α=0.05.

A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5

B:5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3

解:設,分別爲A,B兩個公司的商品次品率整體的均值.則該問題爲在水平α=0.05下檢驗假設::,:

>> A=[7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5];

>> B=[5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3];

>> [p,h,stats]=ranksum(A,B,0.05)

結果爲:

p =0.8041

h =0

stats =zval: -0.2481

ranksum: 116

結果代表:一方面,兩樣本整體均值相等的機率爲0.8041,不接近於0;另外一方面,H=0也說明能夠接受原假設,即認爲兩個公司的商品的質量無明顯差別.

5.signrank-兩個整體中位數相等的假設檢驗——符號秩檢驗

格式

p = signrank(X,Y,alpha) % X,Y爲兩個整體的樣本,長度必須相同,alpha爲顯著性水平,P兩個樣本X和Y的中位數相等的機率,p接近於0則可對原假設質疑.

[p,h] = signrank(X,Y,alpha) % h爲檢驗結果:h=0表示X與Y的中位數之差不顯著,h=1表示X與Y的中位數之差顯著.

[p,h,stats] = signrank(x,y,alpha) % stats中包括:signrank爲符號秩統計量的值以及zval爲過去計算p的正態統計量的值.

例4-78 兩個正態隨機樣本的中位數相等的假設檢驗

>> x=normrnd(0,1,20,1);

>> y=normrnd(0,2,20,1);

>> [p,h,stats]=signrank(x,y,0.05)

p =0.3703

h =0

stats =zval: -0.8960

signedrank: 81

結果代表:h=0表示X與Y的中位數之差不顯著

6.signtest-兩個整體中位數相等的假設檢驗——符號檢驗

格式

p=signtest(X, Y, alpha) % X,Y爲兩個整體的樣本,長度必須相同,alpha爲顯著性水平,P兩個樣本X和Y的中位數相等的機率,p接近於0則可對原假設質疑.

[p, h]=signtest(X, Y, alpha) % h爲檢驗結果:h=0表示X與Y的中位數之差不顯著,h=1表示X與Y的中位數之差顯著.

[p,h,stats] = signtest(X,Y,alpha) % stats中sign爲符號統計量的值

例4-79 兩個正態隨機樣本的中位數相等的假設檢驗

>> X=normrnd(0,1,20,1);

>> Y=normrnd(0,2,20,1);

>> [p,h,stats]=signtest(X,Y,0.05)

p =0.2632

h =0

stats =sign: 7

結果代表:h=0表示X與Y的中位數之差不顯著

7.jbtest-正態分佈的擬合優度測試

格式

H = jbtest(X) %對輸入向量X進行Jarque-Bera測試,顯著性水平爲0.05.

H = jbtest(X,alpha) %在水平alpha而非5%下施行 Jarque-Bera 測試,alpha在0和1之間.

[H,P,JBSTAT,CV] = jbtest(X,alpha) %P爲接受假設的機率值,P越接近於0,則能夠拒絕是正態分佈的原假設;JBSTAT爲測試統計量的值,CV爲是否拒絕原假設的臨界值.

說明

H爲測試結果,若H=0,則能夠認爲X是服從正態分佈的;若X=1,則能夠否認X服從正態分佈.X爲大樣本,對於小樣本用lillietest函數.

例4-80 調用MATLAB中關於汽車重量的數據,測試該數據是否服從正態分佈

>> load carsmall

>> [h,p,j,cv]=jbtest(Weight)

h =1

p =0.0267

j =7.2448

cv =5.9915

說明 p=2.67%表示應該拒絕服從正態分佈的假設;h=1也能否定服從正態分佈;統計量的值j = 7.2448大於接受假設的臨界值cv =5.9915,於是拒絕假設(測試水平爲5%).

8.lillietest-正態分佈的擬合優度測試

格式

H = lillietest(X) %對輸入向量X進行Lilliefors測試,顯著性水平爲0.05.

H = lillietest(X,alpha) %在水平alpha而非5%下施行Lilliefors測試,alpha在0.01和0.2之間.

[H,P,LSTAT,CV] = lillietest(X,alpha) %P爲接受假設的機率值,P越接近於0,則能夠拒絕是正態分佈的原假設;LSTAT爲測試統計量的值,CV爲是否拒絕原假設的臨界值.

說明

H爲測試結果,若H=0,則能夠認爲X是服從正態分佈的;若X=1,則能夠否認X服從正態分佈.

例4-81

>> Y=chi2rnd(10,100,1);

>> [h,p,l,cv]=lillietest(Y)

h =1

p =0.0175

l =0.1062

cv =0.0886

說明 h=1表示拒絕正態分佈的假設;p = 0.0175表示服從正態分佈的機率很小;統計量的值l = 0.1062大於接受假設的臨界值cv =0.0886,於是拒絕假設(測試水平爲5%).

>>hist(Y)

從圖中看出,數據Y不服從正態分佈.

9.kstest-單個樣本分佈的 Kolmogorov-Smirnov 測試

格式

H = kstest(X) %測試向量X是否服從標準正態分佈,測試水平爲5%.

H = kstest(X,cdf) %指定累積分佈函數爲cdf的測試(cdf=[ ]時表示標準正態分佈),測試水平爲5%

H = kstest(X,cdf,alpha) % alpha爲指定測試水平

[H,P,KSSTAT,CV] = kstest(X,cdf,alpha) %P爲原假設成立的機率,KSSTAT爲測試統計量的值,CV爲是否接受假設的臨界值.

說明

　　原假設爲X服從標準正態分佈.若H=0則不能拒絕原假設,H=1則能夠拒絕原假設.

例4-82 產生100個威布爾隨機數,測試該隨機數服從的分佈

>> x=weibrnd(1,2,100,1);

>> [H,p,ksstat,cv]=kstest(x,[x weibcdf(x,1,2)],0.05) %測試是否服從威布爾分佈

H =0

p =0.3022

ksstat =0.0959

cv =0.1340

說明

　　H=0表示接受原假設,統計量ksstat小於臨界值表示接受原假設.

>> [H,p,ksstat,cv]=kstest(x,[x expcdf(x,1)],0.05) %測試是否服從指數分佈

H =1

p =0.0073

ksstat =0.1653

cv =0.1340

說明 H=1代表拒絕服從指數分佈的假設.

>> [H,p,ksstat,cv]=kstest(x,[ ],0.05) %測試是否服從標準正態分佈

H =1

p =3.1285e-026

ksstat =0.5380

cv =0.1340

說明 H=1代表不服從標準正態分佈.

10.kstest2-兩個樣本具備相同的連續分佈的假設檢驗

格式

H = kstest2(X1,X2) %測試向量X1與X2是具備相同的連續分佈,測試水平爲5%.

H = kstest2(X1,X2,alpha) % alpha爲測試水平

[H,P,KSSTAT] = kstest(X,cdf,alpha) %與指定累積分佈cdf相同的連續分佈,P爲假設成立的機率,KSSTAT爲測試統計量的值.

說明

原假設爲具備相同連續分佈.測試結果爲H,若H=0,表示應接受原假設;若H=1,表示能夠拒絕原假設.這是Kolmogorov-Smirnov測試方法.

例4-83

>> x=-1:1:5;

>> y=randn(20,1);

>> [h,p,k]=kstest2(x,y)

h =1

p =0.0444

k =0.5643

說明 h=1表示能夠認爲向量x與y的分佈不相同,相同的機率只有4.4%.

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。