文本特徵抽取的向量空間模型(VSM)和TF/IDF方法

文本特徵抽取 兩組小說,一組是愛情的,另一組是科幻的。我們能否用支持向量機訓練一個模型,用來識別小說類型呢? 這個並不容易。因爲支持向量機這類機器學習算法只能接受數學裏面的向量作爲輸入。如果用它來做文本分類,必須先把文本轉化成向量才行。這就是涉及到一個很重要的話題,如何把文本轉化成向量? 把文本轉化成數學模型,是用數學方法處理文本的先決條件,這個過程稱爲文本特徵抽取。向量作爲一種基本的數學模型,是
相關文章
相關標籤/搜索