Spark Mllib之樸素貝葉斯 - 基於RDD

微信公衆號:數據挖掘與分析學習java 樸素貝葉斯是一種簡單的多類分類算法,假設每對特徵之間具備獨立性。樸素貝葉斯能夠很是有效地訓練。在訓練數據的單次傳遞中,它計算給定標籤的每一個特徵的條件機率分佈,而後應用貝葉斯定理來計算給定觀測值的標籤的條件機率分佈並將其用於預測。算法 spark.mllib支持多項式樸素貝葉斯和伯努利樸素貝葉斯。這些模型一般用於文檔分類。在該上下文中,每一個觀察是一個文檔,
相關文章
相關標籤/搜索