MLlib算法簡介

之前Mahout或者自己寫的MR來解決複雜的機器學習,導致效率低,Spark特別適合迭代式的計算,這正是機器學習算法訓練所需要的,MLlib是基於spark之上算法組件,基於spark平臺來實現。 主要的機器學習的算法目前在MLlib中都已經提供了,分類迴歸、聚類、關聯規則、推薦、降維、優化、特徵抽取篩選、用於特徵預處理的數理統計方法、以及算法的評測。 以上是目前spark1.3支持的算法包,相比
相關文章
相關標籤/搜索