《Learning from Dialogue after Deployment:Feed Yourself, Chatbot!》閱讀筆記——持續學習的對話系統

動機 •語料蒐集困難,當前對話系統就是用人與人的語料來訓練機器人,沒有在人機對話時訓練機器人網絡 •人就是在對話中不斷經過反饋來學習說話的學習 •直接利用人機的對話來學習可能致使錯誤傳播,強化學習的思想是經過指標進行反饋,可是人在實際狀況下是經過天然語言來進行反饋的編碼 主要工做 •本文提出一個能夠在機器人蔘與的對話中選取訓練樣本,他能夠評估用戶對它的回答的滿意度,當對話順利進行就能夠將其做爲新的
相關文章
相關標籤/搜索