Few-Shot Generalization Across Dialogue Tasks《少數據交互對話生成》

摘要 基於機器學習的對話管理器能夠學習複雜的行爲以完成任務,但是將其功能擴展到新領域並不容易。 我們研究了不同政策處理不合作用戶行爲的能力,以及在學習新的任務(例如預訂酒店)時如何重新運用完成一項任務(例如餐廳預訂)的專業知識。 我們介紹了循環嵌入對話策略(REDP),該策略將系統動作和對話狀態嵌入同一向量空間。 REDP包含基於改進的神經圖靈機的內存組件和注意力機制,並且在此任務上明顯優於基準L
相關文章
相關標籤/搜索