1 強化學習(Reinforcement Learning, RL)初步介紹

【下一篇 2 從Multi-arm Bandits問題分析 - RL進階 】html 當前的機器學習算法能夠分爲3種:有監督的學習(Supervised Learning)、無監督的學習(Unsupervised Learning)和強化學習(Reinforcement Learning),結構圖以下所示:web 其餘許多機器學習算法中學習器都是學習怎樣作,而RL是在嘗試的過程當中學習在特定的情境
相關文章
相關標籤/搜索