【強化學習】百度Paddle7日打卡營學習心得

【前言】 挺想爲每一個課節的學習內容都做個介紹,但是最近太忙沒時間弄,加上還是想後面深入理解透了再說。簡單做個心得記錄,順便開個坑篇 【認識強化學習】 智能的核心:與環境中交互學習 像人一樣的自學? 環境:已知的→規劃、未知的→探索和試錯‘ 核心思想: 智能體agent 在環境environment 中學習,根據環境的狀態 state ,執行動作action 並根據環境的反饋 reward(獎勵)
相關文章
相關標籤/搜索