Pearl

用task encoding解決一下問題: 如何從過去學習的任務中針對新的任務獲取有效的信息 如何對新任務的uncertainty作出更準確的判斷   背景: 借用了POMDP的狀態推理與學習分開的思想; 使用了SAC框架   主要工作:本文Meta-learning的流程爲,通過Meta-training過程,對過去積累的tasks experience進行encoding,相當於train出一
相關文章
相關標籤/搜索