doc2vec的深入研究以及實驗探索(一)

時間 2021-01-02

原文原文鏈接

1.doc2vec的基本原理 doc2vec運用了基於神經網絡概率語言模型的自然語言處理技術，其處理過程是：先對足夠豐富的語料庫中的語料進行分詞，形成語料庫詞典，然後利用神經網絡概率語言模型進行語料的訓練，最後爲詞典中的每個詞形成一個多維（一般５０-１００維）的詞向量，而通過計算這些詞向量，就反映了詞向量對應的詞的關係，並且進一步擴展到文本的對應關係上。 word2vec詞

>>阅读原文<<