假設結果變量是一個比率。爲分析比率,必須包含一個記錄每一個觀測的時間長度的變量(如time)。而後,將模型從函數
爲擬合新的模型,須要設置glm()函數中的offset選項,例如在Breslow癲癇研究中,假設病人隨機分組後的檢測時間長度挺在14到60天間變化。你能夠將癲癇發病率做爲因變量(假設已記錄了每一個發病的時間),而後擬合模型:spa
fit.od <- glm(sumY ~ Base + Age + Trt, data=breslow.dat, offset=log(time),family=poisson()) #增長了offset=log(time)
其中sumY指隨機化分組後在每一個病人被研究期間其癲癇發病的次數,此處假定比率不隨事件變化(好比,4天中發生2次癲癇與20天發生10次癲癇比率相同)code
以Logistic回顧迴歸中的婚外情爲例,初始結果變量(affairs)記錄了調查對象婚外情的次數,有些調查者從不婚外情,結構爲0,這便稱爲結構零值對象
此時能夠使用 零膨脹泊松迴歸事件
pscl包中的zeroinfl()函數可作零膨脹迴歸,該模型至關於Logistic迴歸(預測結構零值)和泊松迴歸(預測無結構零值觀測的計數)的組合it
robust包中的glmRob()函數能夠擬合穩健廣義線性模型那個,包含穩健泊松迴歸,當存在離羣點和強影響點時用該方法頗有效變量