環境也能強化學習，智能體要找不着北了，UCL汪軍團隊提出環境設計的新方法...

時間 2021-01-13

原文原文鏈接

雷鋒網 AI 科技評論按：提到「強化學習」，大家都知道這是一種讓智能體尋找優化策略、從而與環境互動獲得獎勵的半監督學習方法。但是在汪軍教授看來，強化學習的應用領域不止如此。在剛剛結束的CCF-GAIR 2017大會中，來自倫敦大學學院 UCL 計算機系的汪軍教授在自己的演講如何進行大規模多智體強化學習？ - 雷鋒網(公衆號：雷鋒網) 中提到了一類他們團隊最近正在研究的環境設計問題，比如宜家希望

>>阅读原文<<