《Learning from Dialogue after Deployment:Feed Yourself, Chatbot!》閱讀筆記——持續學習的對話系統

時間 2020-01-22

標籤 learning dialogue deployment feed chatbot 閱讀筆記持續學習對話系統简体版

原文原文鏈接

動機 •語料蒐集困難，當前對話系統就是用人與人的語料來訓練機器人，沒有在人機對話時訓練機器人網絡 •人就是在對話中不斷經過反饋來學習說話的學習 •直接利用人機的對話來學習可能致使錯誤傳播，強化學習的思想是經過指標進行反饋，可是人在實際狀況下是經過天然語言來進行反饋的編碼主要工做 •本文提出一個能夠在機器人蔘與的對話中選取訓練樣本，他能夠評估用戶對它的回答的滿意度，當對話順利進行就能夠將其做爲新的

>>阅读原文<<