強化學習task01基礎

時間 2020-12-30

標籤筆記简体版

原文原文鏈接

強化學習基礎強化學習討論的問題是一個智能體(agent)可以理解爲是一個ai，把他放到一個複雜的環境(environment)裏面去，規定一個目標，他自己想辦法嘗試去極大化它能獲得的獎勵。在強化學習過程中，agent 跟 environment 一直在交互，類比爲人類與環境無時無刻不在交互。 Agent 在環境會得到一個初始的狀態，agent 會利用這個狀態通過一個決策policy來輸出一個

>>阅读原文<<