強化學習task01基礎

強化學習基礎 強化學習討論的問題是一個 智能體(agent)可以理解爲是一個ai,把他放到一個複雜的環境(environment)裏面去,規定一個目標,他自己想辦法嘗試去極大化它能獲得的獎勵。 在強化學習過程中,agent 跟 environment 一直在交互,類比爲人類與環境無時無刻不在交互。 Agent 在環境會得到一個初始的狀態,agent 會利用這個狀態通過一個決策policy來輸出一個
相關文章
相關標籤/搜索