強化學習(一):簡介

什麼是強化學習 強化學習是想讓一個智能體(agent)在不同的環境狀態(state)下,學會選擇那個使得獎賞(reward)最大的動作(action)。 上圖即是一個強化學習的示意圖。Agent可以看作是一個機器人,這個機器人在t時刻,通過觀測(例如通過各種sensors來觀測世界)環境得到agent自己所在的state(狀態),接下來agent根據policy(策略)進行一些運算(思考,決策)之
相關文章
相關標籤/搜索