Word2Vec學習筆記

這周開始學習word2vec,現在把網課相關內容整理如下: 1、詞向量模型 以前統計文本,基本上基於詞頻,或者TFIDF,面臨兩個問題:1)兩個詞調換順序,但是詞頻等不變,即改變位置不會影響計算結果;2)詞義相近,但會出現截然不同的結果(自然語言處理與NLP被認爲是兩個詞),其實有些詞的詞義是一致的,在空間上或是向量層面上的表達應該是一致的。 一個詞向量的維度通常都是較高的,基本上是50-300維
相關文章
相關標籤/搜索