論文筆記-Learning Latent Dynamics for Planning from Pixels

Learning Latent Dynamics for Planning from Pixels 1 介紹 輸入圖像經過編碼網絡(灰色梯形)變成隱藏狀態(綠色),然後隱藏狀態可以被映射成獎勵和圖片。 爲了預演,我們將當前圖片經過編碼網絡變成當前隱藏狀態變成綠色,然後進行各個序列的虛擬預測,計算各個序列的獎勵,最後返回最好序列的第一個action執行 2 算法 Deep planning net
相關文章
相關標籤/搜索