TeaForN:讓Teacher Forcing更有「遠見」一些

©PaperWeekly 原創 · 作者|蘇劍林 單位|追一科技 研究方向|NLP、神經網絡 Teacher Forcing 是 Seq2Seq 模型的經典訓練方式,而 Exposure Bias則是  Teacher Forcing 的經典缺陷,這對於搞文本生成的同學來說應該是耳熟能詳的事實了。筆者之前也曾寫過文章 Seq2Seq中Exposure Bias現象的淺析與對策,初步地分析過 Exp
相關文章
相關標籤/搜索