解讀!清華、谷歌等10篇強化學習論文總結

強化學習(Reinforcement Learning,RL)正成爲當下機器學習中最熱門的研究領域之一。與常見的監督學習和非監督學習不同,強化學習強調智能體(agent)與環境(environment)的交互,交互過程中智能體需要根據自身所處的狀態(state)選擇接下來採取的動作(action),執行動作後,智能體會進入下一個狀態,同時從環境中得到這次狀態轉移的獎勵(reward)。 強化學習的
相關文章
相關標籤/搜索