入門強化學習1

時間 2021-01-11

標籤強化學習简体版

原文原文鏈接

1.初識強化學習（RL） 2.課程基礎 3.資料學習 4.基本概念核心思想：智能體agent在環境environment中學習，根據環境的狀態state，執行動作action，並根據環境的反饋reward（獎勵）來指導更好的動作。特點：不斷和環境交互，觀察和輸出動作獎勵延遲應用場景：遊戲個性推薦股票交通強化學習與監督學習的區別：

>>阅读原文<<