Spark基礎:使用維基百科數據集來用Spark進行原型實驗

Apache Spark的真正價值和強大能力在於用它可以構建一個統一一致的分析場景,囊括了從ETL(數據抽取、轉換和載入)、批處理分析、實時流分析、機器學習、圖類型數據分析,到可視化的多種功能。在這個歷時2天的課程裏,布萊恩·克萊坡通過對多種維基百科數據集的動手操作來展示了理想中Spark可以完成的多樣化的編程模式。在培訓結束時,參加者將具備運用Spark來進行概念驗證和原型搭建的能力。 本課程包
相關文章
相關標籤/搜索