微軟、阿里、百度、騰訊都在使用的Spark大數據分析實戰

Spark作爲一款基於內存的分佈式計算框架,具有簡潔的接口,可以快速構建上層數據分析算法,同時具有很好的兼容性,能夠結合其他開源數據分析系統構建數據分析應用或者產品。 爲了適合讀者閱讀和掌握知識結構,本篇從Spark基本概念和機制介紹人手,結合筆者實踐經驗講解如何在Spark之上構建機器學習算法,並最後結合不同的應用場景構建數據分析應用。 讀者對象 本篇中一些實操和應用章節,比較適數據分析和開發人
相關文章
相關標籤/搜索