深度增強學習前沿算法思想

http://www.iteye.com/news/32139 目前深度增強學習的算法都可以包含在Actor-Critic框架下,如圖2所示。  圖2 Actor-Critic框架 把深度增強學習的算法認爲是智能體的大腦,那麼這個大腦包含了兩個部分:Actor行動模塊和Critic評判模塊。其中Actor行動模塊是大腦的執行機構,輸入外部的狀態s,然後輸出動作a。而Critic評判模塊則可認爲是大
相關文章
相關標籤/搜索