LTR 之RankNet、LambdaRank、LambdaMART

時間 2019-12-05

標籤 ltr ranknet lambdarank lambdamart 简体版

原文原文鏈接

RankNet

ranknet 是一個pairwise的排序模型，他相比pointwise把樣本排序問題只考慮query與doc的相關性改編爲文檔對的比較問題，更好的利用了樣本中的偏序關係html

排序機率

ranknet首先計算文檔對的排序關係，若有文檔對(d~i~, d~j~),而且文檔i與query的相關性大於文檔j的機率表示以下：算法

同時ranknet證實了只要知道相鄰文檔的排序機率，就能夠推導出任何兩個文檔的排序機率，這樣能夠減小計算。

損失函數

其中

s表示文檔與query相關的得分，感興趣的能夠推導一下，這就是簡單的交叉熵損失函數。

計算總的損失還需加和全部的文檔對的損失，最後用梯度降低法求解函數

LambdaRank

圖中線條表示文檔，藍色線條表示相關文檔，直接經過位序減法獲得的損失左邊爲13，右邊爲11，在經常使用的排序指標如NDCG等，一般關注topK的排序，而對後面的排序不太關注，右邊黑色的箭頭表示ranknet下次梯度降低後的調整方向與強度，而咱們實際須要的是紅色箭頭這樣的調整，更關注top排序。爲此，研究人員分析了排序問題的梯度的物理意義，採起了直接定義梯度，而不是經過定義損失函數求解的方法。

首先，對原有損失函數求梯度分析，分解因式鏈式求導 3d