強化學習的另一種策略(二)

我們在上一篇文章中簡單給大家介紹了反向強化學習的相關概念以及如何理解反向強化學習的知識。通過這些,相信大家對於反向強化學習已經有了一個深刻的理解,我們將在這篇文章中繼續爲大家介紹反向強化學習的內容,希望這篇文章能夠幫助大家更好地理解反向強化學習。 反向強化學習的一般思路是什麼呢?其實思路很簡單,總共有四點,第一點就是隨機生成一個策略作爲agent的初始策略。第二點就是通過比較高手的交互樣本和自身的
相關文章
相關標籤/搜索