高槓杆值點

  • 概念

高槓杆值觀測點 ,即與其餘預測變量有關的離羣點,換句話說,他們是由許多異常的預測變量值組合起來的,與相應變量值沒有關係ide

高槓杆點_百度百科 函數

  • 如何判斷是否爲高杆槓值點

經過帽子 統計量(hat statistic)判斷,對於一個給定的數據集,帽子均值爲p/n,其中 p是模型估計的參數數目(包含截距項),n是樣本量,通常來講,若觀測點的帽子值大於帽子均值的2或3倍,就能夠定位的搞槓桿值,下面畫出了帽子值的分佈spa

hat.plot <- function(fit){
  p <- length(coefficients(fit))  #係數個數,包括截距項
  n <- length(fitted(fit))        #樣本量
  plot(hatvalues(fit),main = "Index Plot Of Hat Values")
  abline(h=c(2,3)*p/n,col="red",lty=2)
  identify(1:n,hatvalues(fit),names(hatvalues(fit)))
}
hat.plot(fit)

 水平線標註的即帽子均值2倍和3倍的位置,定位函數(location function)能以交互模型繪圖,單擊感興趣的點,而後進行標註,中止交互時,用戶可按Esc鍵退出,或從圖形下拉菜單中選Stop,或直接右擊圖形code

高杆槓值點可能會是強影響點,也可能不是,要看它們是否爲離羣點ci

相關文章
相關標籤/搜索