word2vec詳解

在NLP領域裏,將一個單詞用一個有限維的向量表示基本上已經成爲現在進行文本處理的一個標配步驟。在word2vec這個神器出現以前,比較通用的解決步驟是WordNet,可以認爲它是一個類似詞典一樣的存在,查每個詞對應的同義詞、上位詞等信息,好雖好,但是需要人工維護,而且缺乏對詞語新的含義的挖掘,不能做到實時更新,雖然能夠找到一個詞的同義詞,但是詞之間的相似度到底有多高這個指標很難度量。傳統one-h
相關文章
相關標籤/搜索