李紀爲:用於對話生成的深度強化學習

時間 2021-01-13

原文原文鏈接

譯者按：本文第一作者 Jiwei Li (李紀爲) 是斯坦福的 Ph.D ，是一位在神經網絡和 NLP 領域非常高產的作者。在之前發佈的自然語言處理 2012-2016 年頂級會議作者統計中，他以 14 篇頂級會議論文第一作者的數據排名第一。本篇文章剛剛發佈，是一篇探索性的文章，文章結合了目前主流的 sequence-to-sequence 模型和強化學習算法，在之前工作的基礎上，利用一種 Alp

>>阅读原文<<