爲什麼說強化學習是一種人工智能的通用框架?

深度強化學習(Deep Reinforcement Learning) ,強化學習是一種人工智能的通用框架: 1、強化學習是針對一個擁有行動能力的agent 而言的 2、每個行動影響了agent 的未來狀態 3、使用標量值回報信號來度量成功 一言以蔽之:選擇行動來最大化未來回報。我們最終的目標是尋求得到可以解決所有人類層級的任務的單一的agent,這也是智能agent 的本質。 agent和環境
相關文章
相關標籤/搜索