詞袋模型BoW和詞集模型SoW比較

Bag-of-Words詞袋模型,經常用在自然語言處理和信息檢索當中.在詞袋模型中,一篇文本(文章)被表示成"裝着詞的袋子",也就是說忽略文章的詞序和語法,句法;將文章看做詞的組合,文中出現的每個詞都是獨立的,不依賴於其他詞.雖然這個事實上並不成立,但是在實際工作中,效果很好. Set-of-Words詞集模型SoW:用0-1作爲文章中詞的數量表示. 在詞袋模型BoW中,每個詞的數量表示有多種方法
相關文章
相關標籤/搜索