寫給人類的機器學習五、強化學習

時間 2021-01-12

原文原文鏈接

五、強化學習原文：Machine Learning for Humans, Part 5: Reinforcement Learning 作者：Vishal Maini 譯者：飛龍協議：CC BY-NC-SA 4.0 探索和利用。馬爾科夫決策過程。Q 學習，策略學習和深度強化學習。我剛剛吃了一些巧克力來完成最後這部分。在監督學習中，訓練數據帶有來自神一般的「監督者」的答案。如果生活可以這樣

>>阅读原文<<