Permutation test(排列(組合)檢驗)

對Permutation test 的首次描述可追溯到上個世紀30年代, Fisher( 1935) 和Pitman( 1937)
介紹了其在線性統計模型中的應用。但該法計算工做量過大, 其發展在隨後的半個世紀裏未
獲得重視。上個世紀80年代以來, 因爲計算機技術的飛速發展, 使得許多模擬算法成爲可能,
從而造成了許多基於大量計算的統計推斷方法。Permutationtest 就是其中之一。web

Permutationtest 的基本思想是: 根據所研究的問題構造一個檢驗統計量, 並利用手頭樣
本, 按排列組合的原理, 導出檢驗統計量的理論抽樣分佈; 若難以導出確切的理論分佈, 則採用
抽樣模擬的方法作估計其近似分佈。而後求出從該分佈中得到手頭樣本及更極端樣本的機率
( P值) , 並界定此機率值, 做出推論。
若檢驗統計量的抽樣分佈是基於樣本的全部可能的排列( 或組合) 條件下的分佈, 則稱之
爲 Exact PermutationTest( EPT) , 可譯爲 確切排列( 組合) 檢驗 , 其思路相似於秩和檢驗。
對實際問題來講, 每每得不到檢驗統計量的確切抽樣分佈, 可經過基於樣本的大量重複的隨機
排列( 或組合) 估計其近似的抽樣分佈, 則稱之爲 RandomizedPermutationtest( RPT) , 可譯爲
隨機排列( 或組合) 檢驗 。亦有文獻中將EPT稱爲 Exact RandomizationTest( 確切隨機化
檢驗) , 而將RPT稱爲 RandomizationTest( 隨機化檢驗) 。
下面以成組設計的兩樣本均數比較的RPT( 雙側檢驗) 爲例, 介紹其實施的具體步驟:
( 1) 創建假設, 肯定檢驗水準。
與傳統假設檢驗相同。H0: μ1= μ2;  H1: μ1≠μ 2; α=0. 05(雙側檢驗)。
(2) 構造統計量D, 並計算現有樣本統計量D(obs)。
檢驗統計量能夠根據實際狀況構造, 無需考慮檢驗統計量的理論抽樣分佈, 這是Permu
tationtest 之特色。此處, 可選兩樣本均數之差 X1- X2 做爲統計量D。
(3) 在H0 假設條件下, 經過計算機模擬獲得統計量D的 經驗抽樣分佈 。
在H0 假設成立的條件下, 即兩樣原本自同一個整體, 均爲整體的隨機樣本, 那麼對樣
本數據從新隨機分組( 各組樣本含量不變) , 獲得的新樣本也是整體的兩個隨機樣本, 稱之爲
Permutation樣本。並據此計算檢驗統計量D。
重複步驟 k 次( 如100000次) 。
根據k 個Permutation樣本的統計量D, 便可獲得D的 經驗抽樣分佈 。
(4) 計算機率P。
在H0 假設成立的前提下, P值爲 經驗抽樣分佈 中D值大於等於(或小於等於)現有樣
本統計量D(obs)的機率, 即:
P= P(| D|≥ | D(obs) | ) =
number(| D| ≥ | D(obs) | )/k
其中分母k爲隨機重複的次數, 分子爲分母中| D| ≥| D(bos)| 的次數。
( 5) 根據小几率原理做出推斷性結論算法

例1 成組設計的兩樣本均數的比較。
具體數據以下:
第一組: dom

1.4588,0.8234,-0.1939,0.5947,-0.1497,-2.1674,-0.9870,0.6366,-1.0250,0.9604

第二組: spa

0.7381,0.9849,2.0666,2.5958,3.5186,0.8398,2.0789,-0.3106,2.0601,0.0398
相應的R程序
twot.permutation {DAAG}    
> s1=c(1.4588,0.8234,-0.1939,0.5947,-0.1497,-2.1674,-0.9870,0.6366,-1.0250,0.9604)
> s2=c(0.7381,0.9849,2.0666,2.5958,3.5186,0.8398,2.0789,-0.3106,2.0601,0.0398)
> twot.permutation(x1=s1, x2=s2, nsim=500000, plotit=TRUE) #模擬次數爲500000次
[1] 0.011 #p=0.011

參考資料設計

1.PermutationTest 在假設檢驗中的應用    荀鵬程 趙 楊 易洪剛 柏建嶺 於 浩 陳 峯code

2.R help orm

twot.permutation {DAAG} R Documentation

Two Sample Permutation Test - Obsolete

相關文章
相關標籤/搜索