讓機器玩遊戲的強化學習(附github)

時間 2021-01-13

原文原文鏈接

強化學習強化學習是代理面臨的學習問題，它通過與動態環境反覆交互試驗從而學習到某種行爲。它是機器學習的主要學習方法之一，智能體從環境到行爲的學習，也就是如何在環境中採取一些列行爲，才能使得回報信號函數的值最大，即獲得的累積回報最大。現在強化學習與深度學習結合的深度強化學習更加強大。馬爾科夫決策過程在理解強化學習之前，我們先了解我們要解決什麼樣的問題。其實強化學習過程就是優化馬爾科夫決策過程，

>>阅读原文<<