基於世界模型的深度強化學習

起源 世界模型[https://zhuanlan.zhihu.com/p/39928037]被lecun認爲是彌補RL不足和通向下一代AI的要點。雖然Model-Based RL不是新概念,但是世界模型的構建方法,以及提升其泛化能力、注意力能力和記憶容量的設計還是頗具挑戰性。 DaH和LSTM的發明人在今年五月提出了基於非監督學習訓練大規模RNN,用於表徵世界模型,並針對強化學習框架設計了智能體架
相關文章
相關標籤/搜索