基於MLlib的機器學習

1. 簡介 MLlib 是Spark 中提供機器學習函數的庫。它是專爲在集羣上並行運行的狀況而設計的。MLlib 中包含許多機器學習算法,能夠在Spark 支持的全部編程語言中使用,因爲Spark基於內存計算模型的優點,很是適合機器學習中出現的屢次迭代,避免了操做磁盤和網絡的性能損耗。Spark 官網展現的 MLlib 與Hadoop性能對比圖就很是顯著。因此Spark比Hadoop的MapRed
相關文章
相關標籤/搜索