Learning Against Non-Stationary Agents withOpponent Modelling & Deep Reinforcement Learning

時間 2021-07-14

原文原文鏈接

17年nips beach的文章，這個文章是通過爲對手建模，然後更好的切換自己的對戰策略的一個方法。這篇文章，主要是對裏面不確定度有了很好的應用，才能正確的在不同的策略之間比較正確的切換。主要是對兩種方式進行了實驗：首先我們針對第一種來設計算法，而本文也是主要針對第一種情況進行的，第二種用來比較本文提出了SAM算法switching Agent Model 首先我們逐步介紹他的compne

>>阅读原文<<