強化學習(一):簡介

什麼是強化學習 強化學習是想讓一個智能體(agent)在不一樣的環境狀態(state)下,學會選擇那個使得獎賞(reward)最大的動做(action)。web 上圖便是一個強化學習的示意圖。Agent能夠看做是一個機器人,這個機器人在t時刻,經過觀測(例如經過各類sensors來觀測世界)環境獲得agent本身所在的state(狀態),接下來agent根據policy(策略)進行一些運算(思考,
相關文章
相關標籤/搜索