這個高仿真框架AI2-THOR,想讓讓強化學習快速走進現實世界

夏乙 編譯整理 量子位 出品 | 公衆號 QbitAI AlphaGo的節節勝利,向人們展示了強化學習的強大能力。但要是想讓這種方法作用於現實世界,指揮機器人完成開門、拿東西、放東西等等對人類來說輕而易舉的任務,還需要解決一個問題: 一個強化學習模型要經歷多次試錯過程才能收斂,可是讓它在現實世界中一次一次地試錯顯然有些不切實際。 爲了填平這道虛擬和現實世界中的鴻溝,一個名叫AI2-THOR的新框架
相關文章
相關標籤/搜索