ANOVA模型擬合


  • aov()
aov()函數的語法爲
aov(formual,data=dataframe)
 y是因變量,字母A、B、C表明因子                                                                 
                                                                       R 表達式中的特殊符號
符號 用法
~ 分隔符號,左邊爲響應變量,右邊爲解釋變量,如用A、B、C預測y,代碼爲 y~ A + B +C
表示變量的交互項。例如,用A、B和A與B的交互項來預測 y, 代碼 y~ A + B + A:B
* 表示全部可能交互項,代碼 y~A*B*C可展開爲 y~ A + B +C+ A:B + B:C +A:B:C
^ 表示交互項達到某個次數。代碼 y~(A+B+C)^2可展開爲 y~A +B +C+ A:B +A:C +B:C
.(英文句號) 表示包含除因變量外的全部變量。如,某個數據框包含變量 y、A、B和C,代碼 y~. 可展現爲y~A +B +C

常見的研究設計表達式 ,小寫字母表示定量變量,大寫字母表示組別因子,Subject是被試着獨有的標識變量
                                                                 
                          常見研究設計的表達式
設計 表達式
單因素ANOVA y ~ A
含單個協變量的單因素 ANCOVA y ~ x + A
雙因素 ANOVA y ~ A * B
含兩個協變量的雙因素 ANCOVA y ~ x1 + x2 + A*B
隨機化區組 y ~ B + A(B 是區組因子)
單因素組內 ANOVA y ~ A + Error(Subject / A)
含單個組內因子(W)和單個組間因子(B)的重複測量ANOVA y ~ B * W + Error(Subject/W)

  • 表達式中各項的順序
 表達式中效應順序在兩種狀況會形成影響
a、因子不止一個,而且非平衡設計
b、存在協變量  , 協變量的概念
如對於雙因素方差分析,若不一樣的處理方式中觀測數不一樣,那麼模型 y ~ A*B 與 y~B*A 的結果不一樣

R 默認類型Ⅰ(序貫型)方法計算ANOVA效應,第一個模型:y ~ A + B +A:B 。R中的 ANOVA 表的結果將評價:
一、A 對 y 的控制
二、控制 A 時, B 對 y 的影響
三、控制 A 和 B 的主效應時,A與B的交互效應

  • 表達式順序類型
當自變量與其餘自變量或者協變量相關時,沒有明確的方法能夠評價自變量對因變量的貢獻
例如:含因子A、B和因變量 y 的雙因素不平衡因子設計,有三種效應: A 和 B 主效應,A 和 B的交互效應,假設正使用以下表達式對數據進行建模
 y ~ A + B + A:B
有三種方法能夠分解等式右邊各效應對 y 的解釋的方差
  • 類型Ⅰ(序貫型) 
效應根據表達式中線出現的效應作調整,A不作調整,B根據A調整,A:B交互項根據 A 和 B 調整

  • 類型Ⅱ(分層型)
效應根據同水平或低水平的效應作調整,A 根據 B調整,B 根據A調整,A:B交互項同時根據 A 和 B 調整

  • 類型Ⅲ(邊界型)
每一個效應根據模型其餘各效應作相應的調整, A 根據 B和 A:B調整,A:B交互項根據 A和B 調整

R 默認調用類型 Ⅰ 方法,其餘軟件(好比 SAS 和 SPSS)默認調用類型Ⅲ方法

樣本大小越不平衡,效應項的順序對結果的影響越大。通常來講,越基礎性的效應越須要放在表達式前面,具體來說,首先是協變量,而後是主效應,接着是雙因素的交互項,再接着是三因素的交互項,以此類推。
對於主效應,越基礎性的變量越應放在表達式前面,所以性別要放在處理方式以前,有一個基本的準則:若研究設計不是正交(也就是說,因子或協方變量相關),必定要謹慎設置效應的順序

注意
car包中的Anova() 函數提供了使用類型Ⅱ和類型Ⅲ方法的選項,而 aov() 函數使用的是類型Ⅰ方法。
若想使結果與其餘軟件(如SAS和SPSS)提供的結果一致,可使用 Anova()函數,細節可參考help(Anova,package="car")
相關文章
相關標籤/搜索