環境也能強化學習,智能體要找不着北了,UCL汪軍團隊提出環境設計的新方法...

雷鋒網 AI 科技評論按:提到「強化學習」,大家都知道這是一種讓智能體尋找優化策略、從而與環境互動獲得獎勵的半監督學習方法。但是在汪軍教授看來,強化學習的應用領域不止如此。 在剛剛結束的CCF-GAIR 2017大會中,來自倫敦大學學院 UCL 計算機系的汪軍教授在自己的演講 如何進行大規模多智體強化學習? - 雷鋒網(公衆號:雷鋒網) 中提到了一類他們團隊最近正在研究的環境設計問題,比如宜家希望
相關文章
相關標籤/搜索