《Meta Dialogue Policy Learning》Meta-DTQN (DP + RL) 上

時間 2021-01-01

原文原文鏈接

《Meta Dialogue Policy Learning》作者：微軟2020 介紹：研究任務型對話中DP組件的few shot問題與新領域遷移。提出了DTQN以利用跨domains的low-level共享信號(如動作、槽位)。把DTQN嵌入到一個meta-Learning框架，引入了Meta-DTQN。注意現在這個論文還在under review，所以源碼就別想了，不過可以去Conv