2020-08-20 One-Shot Visual Imitation Learning via Meta-Learning 中的雙頭網絡的理解

以下內容來自這個blog 4.1 Two-Head Architecture: Meta-Learning a Loss for Fast Adaptation 在標準的MAML框架中,在「前梯度更新」和「後梯度更新」中,使用的網絡是相同的,都輸出的是action,並且都使用標準的loss function。本文中,我們做出了這樣的嘗試:「前梯度更新」和「後梯度更新」依舊共用前面所有的架構,只是輸
相關文章
相關標籤/搜索