actor-critic框架

最近發現我大自動化的思想在deep learning中很有體現呀,之前說過77要去研究bicnet了,讀完之後從裏面採用的actor-critic框架說起吧,這個就用到了我們自控裏面反饋的思想。 據說今年幾個頂會文章強化學習佔到70%,在圖像、NLP等等方面都廣泛使用,強化學習在博弈論、控制論、運籌學、信息論、模擬優化方法、多主體系統學習、羣體智能、統計學以及遺傳算法等多個領域都有所應用。 上張經
相關文章
相關標籤/搜索