Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 論文翻譯

時間 2021-01-07

原文原文鏈接

文章目錄論文原文鏈接摘要 INTRODUCTION 相關工作背景剖析利用 β \beta β-變分自編碼器進行狀態表示學習的方法實驗環境設置沒有輔助任務的model-free off-policy RL 應用 β \beta β-自編碼器進行交替式的表示學習 β \beta β-自編碼器端到端學習的嘗試我們的方法在像素上的性能簡化實驗編碼器產生的表示的能力泛化到沒有見過的任務