強化學習入門（二）：on-policy與off-policy

時間 2021-01-21

標籤 # 強化學習機器學習简体版

原文原文鏈接

一、名詞解釋即引入原因 1、名詞解釋：翻譯過來就是： On-policy: 學習到的agent以及和環境進行互動的agent是同一個agent Off-policy: 學習到的agent以及和環境進行互動的agent是不同的agent 直觀理解就是： On-policy：相當於你在打遊戲，你在實戰中變強。 Off-policy：相當於你在看直播，你在觀摩中變強。 2、爲何要引入 Off-poli

>>阅读原文<<