Spark學習之路——9.Spark ML

一、簡介 基於RDD的API spark.mllib已進入維護模式。 Spark ML是Spark MLlib的一種新的API,它有下面的優點: 1.面向DataFrame,基於RDD進一步封裝,擁有功能更多的API 2.具有Pipeline功能,可以實現複雜的機器學習模型 3.性能得到提升 二、ML Pipeline 一個pipeline 在結構上會包含一個或多個Stage,每一個 Stage
相關文章
相關標籤/搜索