Learning Against Non-Stationary Agents withOpponent Modelling & Deep Reinforcement Learning

17年nips beach的文章,這個文章是通過爲對手建模,然後更好的切換自己的對戰策略的一個方法。 這篇文章,主要是對裏面不確定度有了很好的應用,才能正確的在不同的策略之間比較正確的切換。 主要是對兩種方式進行了實驗: 首先我們針對第一種來設計算法,而本文也是主要針對第一種情況進行的,第二種用來比較 本文提出了SAM算法switching Agent Model 首先我們逐步介紹他的compne
相關文章
相關標籤/搜索