[ICML2019]TibGM A Transferable and Information-Based Graphical Model Approach for RL筆記

文章目錄 前言 方法 符號與模型 推理 結論 前言 結合圖模型GM將其作爲RL框架的基礎,有可能解決遷移,泛化和探索問題。文中提出一種使用高效推理過程來增強泛化和遷移能力。作者展示了GM中基於互信息(mutual information)的目標,與RL包含標準的最大化獎賞目標和泛化/遷移目標的合併目標的等價性。 方法中,表示環境的隱藏空間被分解爲模塊:1)目的是最大化每個時間步的獎賞;2)全部模塊
相關文章
相關標籤/搜索