強化學習(Reinforcement Learning, RL)初步介紹

下一篇 從Multi-arm Bandits問題分析 - RL進階 】   當前的機器學習算法可以分爲3種:有監督的學習(Supervised Learning)、無監督的學習(Unsupervised Learning)和強化學習(Reinforcement Learning),結構圖如下所示:     其他許多機器學習算法中學習器都是學得怎樣做,而RL是在嘗試的過程中學習到在特定的情境下選擇哪
相關文章
相關標籤/搜索