寫給人類的機器學習 五、強化學習

五、強化學習 原文:Machine Learning for Humans, Part 5: Reinforcement Learning 作者:Vishal Maini 譯者:飛龍 協議:CC BY-NC-SA 4.0 探索和利用。馬爾科夫決策過程。Q 學習,策略學習和深度強化學習。 我剛剛吃了一些巧克力來完成最後這部分。 在監督學習中,訓練數據帶有來自神一般的「監督者」的答案。如果生活可以這樣
相關文章
相關標籤/搜索