詞向量技術原理及應用詳解(一)

文本表示是自然語言處理中的基礎工作,文本表示的好壞直接影響到整個自然語言處理系統的性能。在自然語言處理研究領域,文本向量化是文本表示的一種重要方式。顧名思義,文本向量化就是將文本表示成一系列能夠表達文本語義的向量。無論中文還是英文,詞語都是表達文本處理的最基本單元。當前階段,對文本向量化都是通過詞向量化實現的。當然也有將文章或者句子作爲文本處理的基本單元,像doc2vec和str2vec技術。 接
相關文章
相關標籤/搜索