文本挖掘之文本表示

人工智能AI與大數據技術實戰  公衆號: weic2c 當我們嘗試使用統計機器學習方法解決文本的有關問題時,第一個需要的解決的問題是,如果在計算機中表示出一個文本樣本。一種經典而且被廣泛運用的文本表示方法,即向量空間模型(VSM),俗稱「詞袋模型」。   我們首先看一下向量空間模型如何表示一個文本:   空間向量模型需要一個「字典」:文本的樣本集中特徵詞集合,這個字典可以在樣本集中產生,也可以從外
相關文章
相關標籤/搜索