基於世界模型的深度強化學習

時間 2021-01-01

原文原文鏈接

起源世界模型[https://zhuanlan.zhihu.com/p/39928037]被lecun認爲是彌補RL不足和通向下一代AI的要點。雖然Model-Based RL不是新概念，但是世界模型的構建方法，以及提升其泛化能力、注意力能力和記憶容量的設計還是頗具挑戰性。 DaH和LSTM的發明人在今年五月提出了基於非監督學習訓練大規模RNN，用於表徵世界模型，並針對強化學習框架設計了智能體架

>>阅读原文<<