RL論文閱讀9-mb-MBMF2017

文章目錄 1. Tittle 2. 標籤 3. 總結 3.1 針對問題 3.2 解決辦法 4. 原理 4.1 神經網絡動力學模型 4.2 模型的訓練 4.3 MB-MF整合 1. Tittle source 2. 標籤 Model-Based 3. 總結 3.1 針對問題 model free算法的data efficiency 低 3.2 解決辦法 使用深度神經網絡表示的環境動力學模型來初始化m
相關文章
相關標籤/搜索