走進強化學習

一、什麼是強化學習 強化學習是機器學習裏面的一個分支,是一個智能體通過不斷的與環境產生互動而不斷改進它的行爲,從而積累最大獎勵的一個決策過程。  智能體在完成某項任務時,首先通過動作A與周圍環境進行交互,在動作A和環境的作用下,智能體會產生新的狀態,同時環境會給出一個立即回報。如此循環下去,智能體與環境進行不斷地交互從而產生很多數據。強化學習算法利用產生的數據修改自身的動作策略,再與環境交互,產生
相關文章
相關標籤/搜索