logistics regression

logistics regression用於解決一些二分類問題。好比(純假設)網上購物時,網站會判斷一我的退貨的可能性有多大,若是該用戶退貨的可能性很大,那麼網站就不會推薦改用戶購買退費險。反之,若是該用戶退貨的可能性不大,則能夠推薦該用戶購買退費險。好比以下數據:算法

歷史該類目退貨率,性別,年齡,商品價格,是否新註冊用戶,商品類別,    發生退貨
0.5                        ,0     ,20   , 300        ,0                       ,8            ,     1
0.3                        ,1     ,30   , 50          ,0                       ,5            ,      0

假設以上數據是電商網站總結的一些用戶購買行爲數據,最後一列是這些數據對應的,用戶退貨的狀況。那麼利用logistics regression來解決這類問題就是說,用歷史數據帶入logistics regression來獲得一個模型,這個模型應該可以很好的擬合曆史數據,也就是輸入上述數據的前6列,可以得出一個結果。這個結果應該和第七列相符合。這樣,當出現一個新的數據時,電商網站能夠根據模型判斷這個數據對應的退貨可能性。函數

爲了簡化表述,咱們把數據抽象成下面的矩陣形式網站

x11,x12,x13 ... x1n        y1
x21,x22,x23 ... x2n        y2
...
xm1,xm2,xm3 ... xmn    ym

在logistics中,採用的數學模型叫sigmod函數。code

y = 1 / [ 1 + e (-z)]
z = w0*xi0 + w1*xi1 + w2*xi2 + ... wn*xin

注意, x原本只有n個屬性,可是在算法中咱們加上了一個x0這個屬性,一般爲1. w 是一個和x維度同樣的多維向量。 在logistics regression中,咱們認爲存在一個向量w,把它帶入sigmod函數後可以得出一個較準確的類別y.數學

相關文章
相關標籤/搜索