【莫煩強化學習】視頻筆記(一)2. 強化學習方法彙總

【莫煩強化學習系列視頻】筆記本 第2節 強化學習方法彙總 本節的目的更多是對強化學習的方法及特徵有初步的瞭解。我們可以通過將強化學習方法分類,來逐一理解。 首先是通過是否需要理解環境(環境給我們什麼就是什麼),能夠分爲無模型的強化學習方法和基於模型的強化學習方法。 假設這裏有一個機器人和一個星球X。 無模型的強化學習方法(Model-Free): 不需要理解環境,機器人對星球X一無所知,機器人扔了
相關文章
相關標籤/搜索