doc2vec的深入研究以及實驗探索(一)

1.doc2vec的基本原理       doc2vec運用了基於神經網絡概率語言模型的自然語言處理技術,其處理過程是:先對足夠豐富的語料庫中的語料進行分詞,形成語料庫詞典,然後利用神經網絡概率語言模型進行語料的訓練,最後爲詞典中的每個詞形成一個多維(一般50-100維)的詞向量,而通過計算這些詞向量,就反映了詞向量對應的詞的關係,並且進一步擴展到文本的對應關係上。       word2vec詞
相關文章
相關標籤/搜索