Distributed Representations of Words and Phrases and their Compositionality--翻譯

時間 2021-01-02

標籤文獻翻譯 nlp pytorch 欄目 Microsoft Office 简体版

原文原文鏈接

詞和短語的分佈表示及其構成原作者：Tomas Mikolov等 #摘要最近引入的連續Skip-gram模型是學習高質量分佈向量表示的有效方法，分佈向量表示可以捕獲大量精確的句法和語義關係。在本文中，我們提出了幾個擴展，提高了向量的質量和訓練速度。通過對頻繁的單詞進行二次抽樣，我們獲得了顯着的加速，同時還學習了更多的常規單詞表示。我們還提出了一個分層soft max的簡單替代方案，稱爲負採樣。

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。