spark mllib的優缺點分析

spark提供了不少機器學習庫,咱們只須要填入數據,設置參數就能夠用了。使用起來很是方便。 另一方面,因爲它把全部的東西都寫到了內部,咱們沒法修改其實現過程。要想修改裏面的某個環節,還的修改源碼,從新編譯。 好比kmeans算法,若是沒有特殊需求,很方便。可是spark內部使用的兩個向量間的距離是歐式距離。若是你想改成餘弦或者馬氏距離,就的從新編譯源碼了。 spark裏面的機器學習庫都是一些經典的
相關文章
相關標籤/搜索