利用spark作文本分類(樸素貝葉斯模型)

樸素貝葉斯模型 樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法。對於給定的訓練數據集,首先基於特徵條件獨立假設學習輸入/輸出的聯合機率分佈;而後基於此模型,對給定的輸入x,利用貝葉斯定理求出後驗機率最大的輸出y。至於樸素貝葉斯模型的原理部分,這裏就不講啦,有疑惑的朋友,我推薦看李航的《統計學習方法》中的第四章。我在這裏主要談論的是基於Java版的spark貝葉斯模型。javascript
相關文章
相關標籤/搜索