DEEP LEARNING WITH LOGGED BANDIT FEEDBACK 筆記

時間 2020-12-24

標籤文獻 bandit 推薦简体版

原文原文鏈接

Another url：https://bulihanjie.github.io/2019/04/14/DEEP-LEARNING-WITH-LOGGED-BANDIT-FEEDBACK-筆記/#more 摘要論文中提出BanditNet模型，能夠利用bandit feedback數據，即實體標籤服從某個分佈的數據，能夠有效地使用大量的數據訓練已有的模型使之達到很好的效果。並且模型只需要較少的代

>>阅读原文<<