高槓杆值觀測點 ,即與其餘預測變量有關的離羣點,換句話說,他們是由許多異常的預測變量值組合起來的,與相應變量值沒有關係ide
高槓杆點_百度百科 函數
經過帽子 統計量(hat statistic)判斷,對於一個給定的數據集,帽子均值爲p/n,其中 p是模型估計的參數數目(包含截距項),n是樣本量,通常來講,若觀測點的帽子值大於帽子均值的2或3倍,就能夠定位的搞槓桿值,下面畫出了帽子值的分佈spa
hat.plot <- function(fit){ p <- length(coefficients(fit)) #係數個數,包括截距項 n <- length(fitted(fit)) #樣本量 plot(hatvalues(fit),main = "Index Plot Of Hat Values") abline(h=c(2,3)*p/n,col="red",lty=2) identify(1:n,hatvalues(fit),names(hatvalues(fit))) } hat.plot(fit)
水平線標註的即帽子均值2倍和3倍的位置,定位函數(location function)能以交互模型繪圖,單擊感興趣的點,而後進行標註,中止交互時,用戶可按Esc鍵退出,或從圖形下拉菜單中選Stop,或直接右擊圖形code
高杆槓值點可能會是強影響點,也可能不是,要看它們是否爲離羣點ci