李紀爲:用於對話生成的深度強化學習

譯者按:本文第一作者 Jiwei Li (李紀爲) 是斯坦福的 Ph.D ,是一位在神經網絡和 NLP 領域非常高產的作者。在之前發佈的自然語言處理 2012-2016 年頂級會議作者統計中,他以 14 篇頂級會議論文第一作者的數據排名第一。本篇文章剛剛發佈,是一篇探索性的文章,文章結合了目前主流的 sequence-to-sequence 模型和強化學習算法,在之前工作的基礎上,利用一種 Alp
相關文章
相關標籤/搜索