解讀！清華、谷歌等10篇強化學習論文總結

時間 2020-01-13

標籤解讀清華谷歌強化學習論文總結欄目 Chrome 简体版

原文原文鏈接

強化學習（Reinforcement Learning，RL）正成爲當下機器學習中最熱門的研究領域之一。與常見的監督學習和非監督學習不一樣，強化學習強調智能體（agent）與環境（environment）的交互，交互過程當中智能體須要根據自身所處的狀態（state）選擇接下來採起的動做（action），執行動做後，智能體會進入下一個狀態，同時從環境中獲得此次狀態轉移的獎勵（reward）。算法強

>>阅读原文<<