文本分類的python實現-基於SVM算法

描述 訓練集爲評論文本,標籤爲 pos,neu,neg三種分類,train.csv的第一列爲文本content,第二列爲label。能夠單獨使用SVC訓練而後預測,也能夠使用管道pipeline把訓練和預測放在一塊。 SVC的懲罰參數C:默認值是1.0。C越大,對誤分類的懲罰增大,趨向於對訓練集全分對的狀況,這樣對訓練集測試時準確率很高,但泛化能力弱。C值小,對誤分類的懲罰減少,容許容錯,泛化能力
相關文章
相關標籤/搜索