解讀！清華、谷歌等10篇強化學習論文總結

時間 2021-01-13

原文原文鏈接

強化學習（Reinforcement Learning，RL）正成爲當下機器學習中最熱門的研究領域之一。與常見的監督學習和非監督學習不同，強化學習強調智能體（agent）與環境（environment）的交互，交互過程中智能體需要根據自身所處的狀態（state）選擇接下來採取的動作（action），執行動作後，智能體會進入下一個狀態，同時從環境中得到這次狀態轉移的獎勵（reward）。強化學習的

>>阅读原文<<