【自然語言處理】 詞向量

【傳統的語義向量表示方法】 one-hot:每個詞表示爲一個很長的向量,向量的維度是詞表大小,其中只有一個維度的值爲1,其它元素爲0. 詞袋模型(BOW):將語料庫中所有詞語裝進一個袋子裏,不考慮其詞法和語序的問題,即每個詞語都是獨立的,語料庫中所有的詞組成一個清單進行映射匹配。對於每一個句子或文檔,其對應的下標與映射數組的下標相匹配,其值爲該詞語出現的次數。 例如:該例子來源於百度百科 以下是兩
相關文章
相關標籤/搜索