也有表示爲
必須知足
一、偏差項
知足變異一致
二、X,Y都是取連續值的變量,如農做物的產量,人的身高體重之類的
三、Y 的分佈爲正態,或接近正態分佈之分佈且互相獨立
總的來講,通常線性模型,經過一系列連續型和/或類別型預測變量來預測正態分佈的響應變量,當在不少狀況下,假設因變量爲正態分佈(甚至連續型變量)並不合理,例以下面這幾種狀況
a、結果變量是類別型的:二值變量(好比:是/否,經過/未經過,活着/死亡)和多分類變量(好比差/良好/優秀)都顯然不是正態分佈
b、結果變量多是計數的:一週的交通事故的數目,每日酒水消耗數量,這些都是非負的有限值,並且他們的均值和方差一般都是相關的(正態分佈變量間不是如此,而是互相獨立)
是自變數的一個線性預測 函數
g()叫作鏈接函數,是一個非遞減的可微函數,描述 y 的指望與 之間的關係spa
也有表示爲
g(μy)是條件均值的函數(稱爲鏈接函數),另外能夠放鬆 Y 爲正態分佈的假設,該爲 Y 服從指數分佈族中的一種分佈便可,設定好鏈接函數和機率分佈後,即可以經過最大似然估計的屢次迭代推導出各參數值
注意
廣義線性模型經過
響應變量的條件均值的一個函數(不是響應變量的條件均值),假設響應變量服從指數分佈族中的某個分佈(並不限於正態分佈)
指數分佈族的定義:
是與方差有關的參數,叫作尺度參數(scale parameter) .net
廣義線性模型是常見的正態線性模型的直接推廣,它可適用於連續數據和離散數據,如計數數據、屬性數據
自變量:尺度變量,分類變量,其交互項
因變量:連續變量,兩分類變量和計數數據
線性迴歸模型、方差分析模型、用於列聯表分析的對數線性模型和兩分類數據的logistic迴歸模型等都是廣義線性模型