統計自然語言處理--文本分類

文本表示 文本表示有向量空間模型,詞組表示法,概念表示法 目前文本通常採用向量空間模型表示 文檔 特徵項 可以是詞,短語,文檔可以看成是特徵集合 特徵項的權重,文檔可以用其含有的特徵項以及特徵項的權重表示 ( 向量空間模型( VSM) ) 給定一個文檔D( t1, w1;t2, w2;…;tn, wn) , D符合以下兩條約定: ( 1) 各個特徵項tk( 1≤k≤n) 互異( 即沒有重複) (
相關文章
相關標籤/搜索