向量空間模型

向量空間模型(VSM:Vector space model)是最經常使用的類似度計算模型,在天然語言處理中有着普遍的應用,這裏簡單介紹一下其在進行文檔間類似度計算時的原理。spa 假設共有十個詞:w1,w2,......,w10,而共有三篇文章,d1,d2和d3。統計所得的詞頻表(杜撰的,爲了便於演示用法)以下:.net   w1設計 w2blog w3ci w4文檔 w5get w6table
相關文章
相關標籤/搜索