文本分類的python實現-基於SVM算法

時間 2020-07-25

原文原文鏈接

描述訓練集爲評論文本，標籤爲 pos,neu,neg三種分類，train.csv的第一列爲文本content，第二列爲label。能夠單獨使用SVC訓練而後預測，也能夠使用管道pipeline把訓練和預測放在一塊。 SVC的懲罰參數C：默認值是1.0。C越大，對誤分類的懲罰增大，趨向於對訓練集全分對的狀況，這樣對訓練集測試時準確率很高，但泛化能力弱。C值小，對誤分類的懲罰減少，容許容錯，泛化能力

>>阅读原文<<