ANOVA模型擬合

時間 2019-12-20

標籤 anova 模型擬合简体版

原文原文鏈接

aov()

aov()函數的語法爲

aov(formual,data=dataframe)

 
aov(formual,data=dataframe)

y是因變量，字母A、B、C表明因子

R 表達式中的特殊符號

符號	用法
~	分隔符號，左邊爲響應變量，右邊爲解釋變量，如用A、B、C預測y，代碼爲 y~ A + B +C
：	表示變量的交互項。例如，用A、B和A與B的交互項來預測 y，代碼 y~ A + B + A:B
*	表示全部可能交互項，代碼 y~ABC可展開爲 y~ A + B +C+ A:B + B:C +A:B:C
^	表示交互項達到某個次數。代碼 y~（A+B+C）^2可展開爲 y~A +B +C+ A:B +A:C +B:C
.（英文句號）	表示包含除因變量外的全部變量。如，某個數據框包含變量 y、A、B和C，代碼 y~. 可展現爲y~A +B +C

常見的研究設計表達式，小寫字母表示定量變量，大寫字母表示組別因子，Subject是被試着獨有的標識變量

常見研究設計的表達式

設計	表達式
單因素ANOVA	y ~ A
含單個協變量的單因素 ANCOVA	y ~ x + A
雙因素 ANOVA	y ~ A * B
含兩個協變量的雙因素 ANCOVA	y ~ x1 + x2 + A*B
隨機化區組	y ~ B + A（B 是區組因子）
單因素組內 ANOVA	y ~ A + Error(Subject / A)
含單個組內因子（W）和單個組間因子（B）的重複測量ANOVA	y ~ B * W + Error(Subject/W)

表達式中各項的順序

表達式中效應順序在兩種狀況會形成影響

a、因子不止一個，而且非平衡設計

b、存在協變量，協變量的概念

如對於雙因素方差分析，若不一樣的處理方式中觀測數不一樣，那麼模型 y ~ A*B 與 y~B*A 的結果不一樣

R 默認類型Ⅰ（序貫型）方法計算ANOVA效應，第一個模型：y ~ A + B +A:B 。R中的 ANOVA 表的結果將評價：

一、A 對 y 的控制

二、控制 A 時， B 對 y 的影響

三、控制 A 和 B 的主效應時，A與B的交互效應

表達式順序類型

當自變量與其餘自變量或者協變量相關時，沒有明確的方法能夠評價自變量對因變量的貢獻

例如：含因子A、B和因變量 y 的雙因素不平衡因子設計，有三種效應： A 和 B 主效應，A 和 B的交互效應，假設正使用以下表達式對數據進行建模

y ~ A + B + A：B

有三種方法能夠分解等式右邊各效應對 y 的解釋的方差

類型Ⅰ（序貫型）

效應根據表達式中線出現的效應作調整，A不作調整，B根據A調整，A：B交互項根據 A 和 B 調整

類型Ⅱ（分層型）

效應根據同水平或低水平的效應作調整，A 根據 B調整，B 根據A調整，A:B交互項同時根據 A 和 B 調整

類型Ⅲ（邊界型）

每一個效應根據模型其餘各效應作相應的調整， A 根據 B和 A：B調整，A：B交互項根據 A和B 調整

R 默認調用類型 Ⅰ 方法，其餘軟件（好比 SAS 和 SPSS）默認調用類型Ⅲ方法

樣本大小越不平衡，效應項的順序對結果的影響越大。通常來講，越基礎性的效應越須要放在表達式前面，具體來說，首先是協變量，而後是主效應，接着是雙因素的交互項，再接着是三因素的交互項，以此類推。

對於主效應，越基礎性的變量越應放在表達式前面，所以性別要放在處理方式以前，有一個基本的準則：若研究設計不是正交（也就是說，因子或協方變量相關），必定要謹慎設置效應的順序

注意

car包中的Anova() 函數提供了使用類型Ⅱ和類型Ⅲ方法的選項，而 aov() 函數使用的是類型Ⅰ方法。

若想使結果與其餘軟件（如SAS和SPSS）提供的結果一致，可使用 Anova()函數，細節可參考help(Anova,package="car")

相關文章

相關標籤/搜索

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<