基本概念篇(一),強化學習基本要素

其實本來不想寫這篇的,相信願意往下看的童鞋,對強化學習本身應該有一定了解。但其實你看的多了就會發現,現有很多文章在細節方面還是有不少差異的。因此,這篇文章也是爲了統一本博客的話語體系,爲後面內容打基礎。 首先請看下面這張圖: 上圖就是強化學習的最一般思路。其中Agent代表你實現的各種「牛叉」算法,Environment則代表Agent輸出或作用的對象。其實這一思路,特別類似於我們人類或者自然界的
相關文章
相關標籤/搜索