樸素貝葉斯模型結合 Tf-idf 算法進行文本分類

1、樸素貝葉斯的原理 基於樸素貝葉斯公式,比較出後驗機率的最大值來進行分類,後驗機率的計算是由先驗機率與類條件機率的乘積得出,先驗機率和類條件機率要經過訓練數據集得出,即爲樸素貝葉斯分類模型,將其保存爲中間結果,測試文檔進行分類時調用這個中間結果得出後驗機率。算法 2、樸素貝葉斯應用場景 須要一個比較容易解釋,並且不一樣維度之間相關性較小的模型的時候。 能夠高效處理高維數據,雖然結果可能不盡如人意
相關文章
相關標籤/搜索