[ICML2019]TibGM A Transferable and Information-Based Graphical Model Approach for RL筆記

時間 2020-12-30

標籤論文筆記简体版

原文原文鏈接

文章目錄前言方法符號與模型推理結論前言結合圖模型GM將其作爲RL框架的基礎，有可能解決遷移，泛化和探索問題。文中提出一種使用高效推理過程來增強泛化和遷移能力。作者展示了GM中基於互信息（mutual information）的目標，與RL包含標準的最大化獎賞目標和泛化/遷移目標的合併目標的等價性。方法中，表示環境的隱藏空間被分解爲模塊：1）目的是最大化每個時間步的獎賞；2）全部模塊

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。