解讀!清華、谷歌等10篇強化學習論文總結

強化學習(Reinforcement Learning,RL)正成爲當下機器學習中最熱門的研究領域之一。與常見的監督學習和非監督學習不一樣,強化學習強調智能體(agent)與環境(environment)的交互,交互過程當中智能體須要根據自身所處的狀態(state)選擇接下來採起的動做(action),執行動做後,智能體會進入下一個狀態,同時從環境中獲得此次狀態轉移的獎勵(reward)。算法 強
相關文章
相關標籤/搜索