spark 基於MLlib的機器學習 Spark MLlib

MLlib是Spark中提供機器學習學習函數的庫。它是專爲在集羣上並行運行的情況而設計的。 MLlib的設計理念十分簡單:把數據以RDD的形式表示,然後在分佈式數據集上調用各種算法。MLlib引入了一些數據類型(比如點和向量),不過歸根結底,MLlib就是RDD一系列可供調用的的函數的集合。 MLlib由一些通用的學習算法和工具組成,包括分類、迴歸、聚類、協同過濾、降維等,同時還包括底層的優化原語
相關文章
相關標籤/搜索