spark:ML和MLlib的區別

ML和MLlib的區別以下: 數據結構 ML是升級版的MLlib,最新的Spark版本優先支持ML。 ML支持DataFrame數據結構和Pipelines,而MLlib僅支持RDD數據結構。 ML明確區分了分類模型和迴歸模型,而MLlib並未在頂層作此類區分。 ML經過DataFrame元數據來區分連續和分類變量。 ML中的隨機森林支持更多的功能:包括重要度、預測機率輸出等,而MLlib不支持。
相關文章
相關標籤/搜索