改進向量空間模型

聲明:只是對向量空間模型的介紹(或者叫推廣),並沒有理論創新工作。 本人在之前的《向量空間模型(VSM)在文檔相似度計算上的簡單介紹》和《向量空間模型文檔相似度計算實現(C#)》兩篇文章中分別介紹了簡單SVM模型及其實現。 本人使用簡單詞頻(即詞在當前文檔中出現的次數)信息,實現了一個樸素版本的向量空間模型,效果尚可,但還是有很多可改進之處。 直接使用詞的個數在比較詞數很多和詞數很少的文檔時存在着
相關文章
相關標籤/搜索