中文詞向量:Word2vec 從熟悉到入門

Word2vec 也叫 Word Embeddings,中文名「詞向量」,作用就是將自然語言中的字詞轉爲計算機可以理解的稠密向量(Dense Vector)。在 Word2vec 出現之前,自然語言處理經常把字詞轉爲離散的單獨的符號,這種編碼方式稱爲 One-Hot Encoder。 在自然語言處理領域也就是在 Bert 跟 Xlnet 模型出現以前(2019 年是 NLP 領域突飛猛進的一年,B
相關文章
相關標籤/搜索