入門強化學習1

1.初識強化學習(RL) 2.課程基礎 3.資料學習 4.基本概念 核心思想:智能體agent在環境environment中學習,根據環境的狀態state,執行動作action,並根據環境的反饋reward(獎勵)來指導更好的動作。 特點: 不斷和環境交互,觀察和輸出動作 獎勵延遲 應用場景: 遊戲 個性推薦 股票 交通 強化學習與監督學習的區別:
相關文章
相關標籤/搜索