基於的樸素貝葉斯的文本分類(附完整代碼(spark/java)

本文主要包括如下內容: 1)模型訓練數據生成(demo) 2 ) 模型訓練(spark+java),數據存儲在hdfs上 3)預測數據生成(demo) 4)使用生成的模型進行文本分類。java 1、訓練數據生成 spark mllib模型訓練的輸入數據格式一般有兩種,一種叫作 LIBSVM 格式,樣式以下: label index1:value1 index2:value2 label爲類別標籤,
相關文章
相關標籤/搜索