NLP 4

Word2Vec 將文本轉爲計算機可以理解的數字表達,我們在機器學習時採用的方法是TF-IDF,但TF-IDF是基於信息熵的一種統計手段,無法精準刻畫詞的上下文關係。Word2Vec是對基於上下文的詞進行預測,在Word2Vec中,我們會設置一箇中心詞,以及時間窗口。根據預測的出發點和結束點的不同,分爲Skip-grams方法和CBOW方法,SG方法是詞爲自變量,預測周圍可能的詞,CBOW方法是以
相關文章
相關標籤/搜索