Cascade bandit 和DCM bandit

摘要   當用戶在搜索引擎上查詢感興趣的條目時,通常得到一個包含相關網頁鏈接的列表。用戶從第一個網頁鏈接開始,瀏覽所有的感興趣的鏈接並點擊,直至得到想要的結果或者是最後一個鏈接爲止。這種用戶瀏覽行爲稱爲dependent click model(DCM)。論文通過最大化推薦的網頁鏈接推薦滿意度,向用戶推薦最合適的網頁鏈接。在此報告中,先介紹與論文相關的多臂賭博機問題(multi-armed ban
相關文章
相關標籤/搜索