《Meta Dialogue Policy Learning》Meta-DTQN (DP + RL) 上

《Meta Dialogue Policy Learning》 作者:微軟2020 介紹: 研究任務型對話中DP組件的few shot問題與新領域遷移。 提出了DTQN以利用跨domains的low-level共享信號(如動作、槽位)。 把DTQN嵌入到一個meta-Learning框架,引入了Meta-DTQN。 注意現在這個論文還在under review,所以源碼就別想了,不過可以去Conv
相關文章
相關標籤/搜索