強者聯盟——Python語言結合Spark框架

引言:Spark由AMPLab實驗室開發,其本質是基於內存的快速迭代框架,「迭代」是機器學習最大的特點,因此非常適合做機器學習。得益於在數據科學中強大的表現,Python語言的粉絲遍佈天下,如今又遇上強大的分佈式內存計算框架Spark,兩個領域的強者走到一起,自然能碰出更加強大的火花(Spark可以翻譯爲火花),因此本文主要講述了PySpark。 本文選自《全棧數據之門》。 全棧框架   Spar
相關文章
相關標籤/搜索