伯克利吳翼&FAIR田淵棟等人提出強化學習環境House3D

構建虛擬 3D 環境對於強化學習研究非常重要。近日,UC Bekerley 博士生吳翼、FAIR 研究工程師吳育昕、博士後 Georgia Gkioxari 和研究科學家田淵棟共同提交了一篇論文,提出一種基於 SUNCG 數據集構建的豐富、可擴展的高效環境 House3D。研究者用連續和離散動作空間訓練強化學習智能體,改善了它們在新環境中的泛化能力。該論文目前已提交至 ICLR 2018 大會。
相關文章
相關標籤/搜索