Spark MLlib介紹

Spark MLlib介紹 Spark之所以在機器學習方面具有得天獨厚的優勢,有以下幾點原因: (1)機器學習算法一般都有很多個步驟迭代計算的過程,機器學習的計算需要在多次迭代後獲得足夠小的誤差或者足夠收斂纔會停止,迭代時如果使用Hadoop的MapReduce計算框架,每次計算都要讀/寫磁盤以及任務的啓動等工作,這回導致非常大的I/O和CPU消耗。而Spark基於內存的計算模型天生就擅長迭代計算
相關文章
相關標籤/搜索