JavaShuo
欄目
標籤
on-policy
on-policy
全部
A thorough understanding of on-policy and off-policy in Reinforcement learning
2020-12-24
on-policy
off-policy
強化學習
Bourne強化學習筆記2:徹底搞清楚什麼是Q-learning與Sarsa
2020-12-30
Q-learning
Saras
off-policy
on-policy
DQN
Bourne強化學習筆記1:用簡單例子說明Off-policy的思想與使用方法
2021-01-13
off-policy
Q-learning
on-policy
強化學習:基於MDP的經典RL方法 (基於南大俞揚博士演講的少量修改和補充)
2021-01-16
Q-learning
SARSA
off-policy
on-policy
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。