aov(formual,data=dataframe)
y是因變量,字母A、B、C表明因子
R 表達式中的特殊符號
符號 |
用法 |
~ |
分隔符號,左邊爲響應變量,右邊爲解釋變量,如用A、B、C預測y,代碼爲 y~ A + B +C |
: |
表示變量的交互項。例如,用A、B和A與B的交互項來預測 y, 代碼 y~ A + B + A:B |
* |
表示全部可能交互項,代碼 y~A*B*C可展開爲 y~ A + B +C+ A:B + B:C +A:B:C |
^ |
表示交互項達到某個次數。代碼 y~(A+B+C)^2可展開爲 y~A +B +C+ A:B +A:C +B:C |
.(英文句號) |
表示包含除因變量外的全部變量。如,某個數據框包含變量 y、A、B和C,代碼 y~. 可展現爲y~A +B +C |
常見的研究設計表達式 ,小寫字母表示定量變量,大寫字母表示組別因子,Subject是被試着獨有的標識變量
常見研究設計的表達式
設計 |
表達式 |
單因素ANOVA |
y ~ A |
含單個協變量的單因素 ANCOVA |
y ~ x + A |
雙因素 ANOVA |
y ~ A * B |
含兩個協變量的雙因素 ANCOVA |
y ~ x1 + x2 + A*B
|
隨機化區組 |
y ~ B + A(B 是區組因子) |
單因素組內 ANOVA |
y ~ A + Error(Subject / A) |
含單個組內因子(W)和單個組間因子(B)的重複測量ANOVA |
y ~ B * W + Error(Subject/W) |
表達式中效應順序在兩種狀況會形成影響
a、因子不止一個,而且非平衡設計
如對於雙因素方差分析,若不一樣的處理方式中觀測數不一樣,那麼模型 y ~ A*B 與 y~B*A 的結果不一樣
R 默認類型Ⅰ(序貫型)方法計算ANOVA效應,第一個模型:y ~ A + B +A:B 。R中的 ANOVA 表的結果將評價:
一、A 對 y 的控制
二、控制 A 時, B 對 y 的影響
三、控制 A 和 B 的主效應時,A與B的交互效應
當自變量與其餘自變量或者協變量相關時,沒有明確的方法能夠評價自變量對因變量的貢獻
例如:含因子A、B和因變量 y 的雙因素不平衡因子設計,有三種效應: A 和 B 主效應,A 和 B的交互效應,假設正使用以下表達式對數據進行建模
y ~ A + B + A:B
有三種方法能夠分解等式右邊各效應對 y 的解釋的方差
效應根據表達式中線出現的效應作調整,A不作調整,B根據A調整,A:B交互項根據 A 和 B 調整
效應根據同水平或低水平的效應作調整,A 根據 B調整,B 根據A調整,A:B交互項同時根據 A 和 B 調整
每一個效應根據模型其餘各效應作相應的調整, A 根據 B和 A:B調整,A:B交互項根據 A和B 調整
R 默認調用類型 Ⅰ 方法,其餘軟件(好比 SAS 和 SPSS)默認調用類型Ⅲ方法
樣本大小越不平衡,效應項的順序對結果的影響越大。通常來講,越基礎性的效應越須要放在表達式前面,具體來說,首先是協變量,而後是主效應,接着是雙因素的交互項,再接着是三因素的交互項,以此類推。
對於主效應,越基礎性的變量越應放在表達式前面,所以性別要放在處理方式以前,有一個基本的準則:若研究設計不是正交(也就是說,因子或協方變量相關),必定要謹慎設置效應的順序
注意
car包中的Anova() 函數提供了使用類型Ⅱ和類型Ⅲ方法的選項,而 aov() 函數使用的是類型Ⅰ方法。
若想使結果與其餘軟件(如SAS和SPSS)提供的結果一致,可使用 Anova()函數,細節可參考help(Anova,package="car")