python+word2vec+隨機森林 微博文本情感極性分析(一)

數據源:36萬條微博文本,已標註情感。源數據中label0:開心,label1-3:低落或憂傷。本文只考慮情感正負極性,因此1-3都劃爲負樣本。 項目思路:分詞後利用gensim.models.word2vec訓練詞向量,詞向量表示訓練集文本,sklearn訓練隨機森林模型,auc=0.86。python 加載相關python包:web import jieba import re import
相關文章
相關標籤/搜索