讓機器玩遊戲的強化學習(附github)

強化學習 強化學習是代理面臨的學習問題,它通過與動態環境反覆交互試驗從而學習到某種行爲。它是機器學習的主要學習方法之一,智能體從環境到行爲的學習,也就是如何在環境中採取一些列行爲,才能使得回報信號函數的值最大,即獲得的累積回報最大。 現在強化學習與深度學習結合的深度強化學習更加強大。 馬爾科夫決策過程 在理解強化學習之前,我們先了解我們要解決什麼樣的問題。其實強化學習過程就是優化馬爾科夫決策過程,
相關文章
相關標籤/搜索