DEEP LEARNING WITH LOGGED BANDIT FEEDBACK 筆記

Another url:https://bulihanjie.github.io/2019/04/14/DEEP-LEARNING-WITH-LOGGED-BANDIT-FEEDBACK-筆記/#more 摘要 論文中提出BanditNet模型,能夠利用bandit feedback數據,即實體標籤服從某個分佈的數據,能夠有效地使用大量的數據訓練已有的模型使之達到很好的效果。並且模型只需要較少的代
相關文章
相關標籤/搜索