詞和短語的分佈式表示及其組合性——論文閱讀

簡介 這篇文章是Word2Vec的作者,主要工作: 1. 提出skip-gram模型的擴展。如通過對高頻詞的二次取樣(Subsampling)以提高高頻詞詞向量的訓練速度(2-10倍)和較低頻詞的詞向量表示的質量; skip-gram模型:學習高質量分佈式向量表示的有效方法,可以捕獲大量準確的句法和語義關係。 2. 提出了簡化的噪聲對比估計變體(simplified variant of Nois
相關文章
相關標籤/搜索