強化學習介紹

兩年前,倫敦的一家小公司DeepMind向Arxiv上傳了他們的開創性論文「 Playing Atari with Deep Reinforcement Learning 」。在那篇文章中,他們演示了計算機是如何經過只觀察屏幕像素,並在遊戲得分增長時收到獎勵這種學習模式去玩Atari 2600 視頻遊戲的。結果是顯著的,由於每一個遊戲和每一個遊戲的目標是很是不一樣的,這些設計的遊戲對人類而言也是不
相關文章
相關標籤/搜索