項目(一)(2):對公司評論利用樸素貝葉斯模型進行分類

1、基於樸素貝葉斯的評論分類 (1)評論的預處理 由於評論是一句話,所以這裏我們採用jieba函數將評論進行分詞,包括以下幾點處理: ①加入專有的詞彙,如公司名字、地名、人名、專有詞彙(如工資:10k,數字等等)等等讓jieba更好的分詞 ②去掉停用詞 ③去掉一些特殊符號 (2)樸素貝葉斯的原理 w j w_j wj​是第i個類別的第j個詞,v代表全部的詞空間, x i j x_{ij} xij​
相關文章
相關標籤/搜索