RL an introduction學習筆記(1)：Muti-arm Bandits

時間 2021-01-13

標籤強化學習 reinforcement learning RL an introduction 简体版

原文原文鏈接

Blog中的代碼參考了Reinforcement learning an introduction的實例代碼，Github地址如下： ShangtongZhang/reinforcement-learning-an-introduction 目錄 1. 從問題入手： 1.1 問題描述：Muti-arm Bandits 1.2 問題簡化：10-armed testbed 1.3 執行流程：The C

>>阅读原文<<