方差分析(ANOVA)(轉)

轉自:http://blog.sciencenet.cn/blog-116082-218338.htmlhtml

方差分析(analysis of variance,ANOVA),即變量分析,是對多個樣本平均數差別顯著性檢驗的方法。
 
  在一個多處理試驗中,能夠獲得一系列不一樣的觀測值。形成觀測值不一樣的緣由是多方面的,有的是不一樣的處理引發的,即處理效應;有的是試驗過程當中偶然性因素的干擾和測量偏差形成的,即偏差效應。方差分析的基本思想就是將測量數據的總變異按變異緣由不一樣分解爲處理效應和試驗偏差,並做出其數量估計。要正確認識觀測值的變異是由處理效應仍是偏差效應引發的,咱們能夠計算出處理效應的均方和偏差效應的均方,在必定意義下進行比較,從而檢驗處理間的差別顯著性。
假設一個試驗有k個處理,每一個處理有n個觀測數據,則總共有nk的觀測值。用表示第i個處理的第j個觀測值,其中i=1,2,3,...,k;j=1,2,3,...,n。表示第i個處理觀測值的整體平均數,表示試驗偏差,則有:,即第i個處理的第j個觀測值是由該處理的整體平均數加上不可避免的試驗偏差組成的。而對於整體平均數(全部nk個觀測數據的平均數),則有。若將各自處理水平上的整體平均數視爲在整體平均數的基礎上施加了不一樣的處理效應形成了,則有。綜上,,即任一個觀測數據都是由整體平均數加上處理效應以及試驗偏差組成的。同理,對於由樣本估計的線性模型爲:
爲樣本平均數,爲第i個處理的效應,爲試驗偏差。根據的不一樣假定,上述模型可分爲:
  固定模型(fixed model):各個處理的效應值是固定的,即除去隨機偏差外每一個處理所產生的效應是固定的,是個常量且之和爲0。此時的試驗處理水日常是根據目的事先主觀選定的,如幾種不一樣溫度下小麥籽粒的發芽狀況。
  隨機模型(random model):各個處理的效應值不是固定的,而是由隨機因素所引發的效應。是從指望均值爲0,方差爲的正態整體中獲得的隨機變量。如調查不一樣生境下某物種的生長情況時,不一樣生境的氣候、土壤條件及水分條件等屬於沒法認爲控制的因素,就要用隨機模型來處理。
  混合模型(mixed model):多因素試驗中,既包括固定效應的因素,又包括隨機效應的因素,則該試驗應對應於混合模型。
不一樣模型的側重點不徹底相同,方差指望值也不同。固定模型主要側重於效應值的估計和比較,隨機模型則側重效應方差的估計和檢驗。所以在進行分析及試驗以前就要明確關於模型的基本假設。對於單因素方差分析,固定模型和隨機模型沒有多大差異。
 
方差分析的步驟:
  (進行方差分析時須要知足獨立樣本、方差齊性、正態分佈等條件,若是方差不具有齊性(F檢驗),可首先進行數據轉換,如進行對數轉換等)
根據方差分析的基本思想,首先要將測量數據的總變異進行拆分,分爲處理效應和試驗偏差,而後將處理間方差與處理內方差(偏差方差)進行F檢驗,判斷處理效應與試驗偏差差別是否顯著。
1.處理間方差和處理內方差的計算:
(1)平方和的拆分:
 

  爲第i個處理n個觀測數據的平均數,爲所有nk個觀測數據的平均數,則有:(試驗偏差)和(處理效應),即觀測數據的總變異是試驗偏差與處理效應之和。
  將等式兩邊平方:
每個處理的n個觀測數據累加:
 
  因爲,在同一處理水平上爲定值,則上式有:
  把k個處理再累加則有:
 
  其中:
 
  爲總平方和,用表示;爲處理間平方和,用表示;爲組內平方和,用表示。因此:
 
 
(2)自由度的分解:
  ,即總自由度=處理間自由度+處理內自由度
 
  
   
   
   則:
  最後,根據各變異部分的平方和與自由度,得處理間方差和處理內方差
 
  
2.統計假設的顯著性檢驗—F檢驗:
 
  
  比較計算所得F值與某顯著水平(如0.05)下F值,可得處理間差別是否顯著。若處理間差別顯著,則需進一步比較哪些處理間差別是顯著的。
3.多重比較(multiple comparisions)
  經常使用的方法有:最小顯著差數法(the least significant difference,LSD)和最小顯著極差法(the least significant range,LSR)。
  LSD法:實質是兩個平均數比較的t檢驗法
  因爲,得
  當時,
  爲處理內偏差方差,n爲同一處理內重複次數。
 
  將在必定顯著水平上達到差別顯著的最小差數LSD定義爲:
  
  當,即在給定的顯著水平下差別顯著,反之,差別不顯著。
  LSR法:採用不一樣平均數間用不一樣的顯著差數標準進行比較,依據極差範圍內所包含的處理數據(也稱爲秩次距)k的不一樣而採用不一樣的檢驗尺度。經常使用的方法有新復極差檢驗(Duncan法)和q檢驗(SNK)法。
  新復極差檢驗(new multiple range test):也稱爲Duncan法、SSR法。
  當時,定義某顯著水平下,爲處理內偏差方差,n爲同一處理內重複次數。將需比較的各平均數按從大到小的順序排列,則相鄰兩個平均數位次上的差異M=2,隔一個則M=3,以此類推。根據M值和自由度,便可查新復極差檢驗SSR值表得,而後得出
  將需比較的兩平均數之差與對應的值比較,則可判斷差別是否顯著。
 
  ,則差別顯著,反之不顯著。
 
  q檢驗法:SNK法,本質與LSR法相同,將LSR法中的替換爲,查值表。
  當排序秩次超過3時,三種檢驗的尺度關係爲LSD法
 
  多重比較結果標記的方法之一:標記字母法。
  首先將所有平均數從大到小依次排列,最大的字母上標a,將該平均數與如下各平均數相比較,凡差別不顯著的標a,直至與之差別顯著的平均數標b,而後以此平均數爲標準,與比它大的平均數比較,差別不顯著的在a的後邊標b,而後再以標b的最大的平均數爲標準,與如下未標字母的平均數比較,凡差別不顯著的仍然標b,直至差別顯著的標c,以此類推,直至全部平均數都標記上字母爲止。
 
 
注:當處理內觀測次數(重複數)不相同時,計算公式有所改變。
相關文章
相關標籤/搜索