第一課 強化學習簡介

David silver強化學習課程第一課 強化學習簡介 本章主要介紹了強化學習涉及到的一些基礎概念,包括強化學習解決的是哪類問題,涉及哪些要素以及解決強化學習問題的思路。 1 強化學習的特徵 是什麼使得強化學習不同於其他機器學習範式呢? 不存在監督,只有獎勵作爲指導信號 獎勵是延遲的,比如遊戲結束時反饋一個正/負信號(也存在實時獎勵吧,比如迷宮遊戲爲了尋找最短路徑,每走一步獎勵設置爲-1) 事件
相關文章
相關標籤/搜索