使用spark mllib 隨機森林算法對文本進行多分類

一、數據準備 20W人工標註文本數據,樣本以下:css 1#k-v#*亮亮愛寵*波波寵物指甲鉗指甲剪附送銼刀適用小型犬及貓特價 1#k-v#*順豐包郵*寵物藥品聖馬利諾PowerIgG免疫力球蛋白犬貓細小病毒 1#k-v#*包郵*法國羅斯蔓草本精華寵物浴液薰衣草護色潤澤香波拍套餐 1#k-v#*包郵*家朵102寵物沐浴液 1#k-v#*包郵*家朵102寵物沐浴液貓 二、分詞 使用ansj包對文本數
相關文章
相關標籤/搜索