Spark Mllib之決策樹-分類與迴歸

微信公衆號:數據挖掘與分析學習 決策樹及其集成算法是分類和迴歸的機器學習任務的流行方法。決策樹被廣泛使用,因爲它們易於解釋,處理分類特徵,擴展到多類分類設置,不需要特徵縮放,並且能夠捕獲非線性和特徵交互。諸如隨機森林和提升樹集成算法是分類和迴歸任務中表現較好的算法。 spark.mllib支持使用連續和分類特徵進行二分類和多類分類以及迴歸的決策樹。該實現按行分區數據,允許數百萬個實例的分佈式訓練。
相關文章
相關標籤/搜索