多重共線性

  • 多重共線性
當迴歸模型中兩個或者兩個以上的自變量彼此相關時,則稱爲迴歸模型中存在多重共線性
會致使模型參數的置信區間過大,使單個係數解釋起來困難

  • vif() 
能夠使用VIF(Variance Inflation Factor,方差膨脹因子)進行檢測。VIF的平方根表示變量回歸參數的置信區間能膨脹爲與模型無關的預測變量的程度(所以而得名)。car包中的vif()函數提供VIF值,通常原則下    > 2代表存在 多重共線性問題
代碼以下
> library(car)
> vif(fit)
Population Illiteracy     Income      Frost   #若是值大於10,則通常存在嚴重的多重共線性問題
  1.245282   2.165848   1.345822   2.082547 
> sqrt(vif(fit)) > 2 # problem?
Population Illiteracy     Income      Frost   #結果代表不存在多重共線性問題
     FALSE      FALSE      FALSE      FALSE

相關文章
相關標籤/搜索