爲什麼說強化學習是一種人工智能的通用框架？

時間 2020-12-29

原文原文鏈接

深度強化學習(Deep Reinforcement Learning) ，強化學習是一種人工智能的通用框架： 1、強化學習是針對一個擁有行動能力的agent 而言的 2、每個行動影響了agent 的未來狀態 3、使用標量值回報信號來度量成功一言以蔽之：選擇行動來最大化未來回報。我們最終的目標是尋求得到可以解決所有人類層級的任務的單一的agent，這也是智能agent 的本質。 agent和環境

>>阅读原文<<