LSA和PLSA

 1.詞袋模型    詞袋模型(BOW, Bag-of-Words) 模型是NLP領域中的一個基本假設,一個文檔(document)被表示爲一組單詞(word/term)的無序組合,而忽略了語法或者詞序的部分,存在缺陷:   稀疏性: 對於大詞典,尤其是包括了生僻字的詞典,文檔稀疏性不可避免;   多義詞: BOW模型只統計單詞出現的次數,而忽略了一個詞可能存在多種含義,一詞多義;   同義詞(S
相關文章
相關標籤/搜索