Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 論文翻譯

文章目錄 論文原文鏈接 摘要 INTRODUCTION 相關工作 背景 剖析利用 β \beta β-變分自編碼器進行狀態表示學習的方法 實驗環境設置 沒有輔助任務的model-free off-policy RL 應用 β \beta β-自編碼器進行交替式的表示學習 β \beta β-自編碼器端到端學習的嘗試 我們的方法 在像素上的性能 簡化實驗 編碼器產生的表示的能力 泛化到沒有見過的任務
相關文章
相關標籤/搜索