強化學習（Reinforcement Learning, RL）初步介紹

時間 2021-01-02

原文原文鏈接

下一篇從Multi-arm Bandits問題分析 - RL進階】　　當前的機器學習算法可以分爲3種：有監督的學習（Supervised Learning）、無監督的學習（Unsupervised Learning）和強化學習（Reinforcement Learning），結構圖如下所示：　　其他許多機器學習算法中學習器都是學得怎樣做，而RL是在嘗試的過程中學習到在特定的情境下選擇哪

>>阅读原文<<