利用TFIDF進行實時微博情感分類

一、思路分析 先來分析一下思路: 本項目所用的語料庫是pos.txt和neg.txt兩個文件,分別代表pos(積極)和neg(消極)類別,文件中有很多條已經分好類的微博,一整行爲一條。                                  1、計算tf tf應該分類別計算。分別計算某個詞在每個類別中的tf。這是什麼意思呢?我們往下看。 某一個詞在某種類別的tf=這類文件中這個詞出現的次
相關文章
相關標籤/搜索