spark簡介(一)

spark是一個用於大規模數據處理的統一計算引擎。適用於各種各樣原先需要多種不同的分佈式平臺處理的場景,包括批處理、迭代計算、交互式查詢、流處理。通過統一的框架將各種處理流程整合到一起。 spark特性 快速性 spark通過使用先進的DAG調度器、查詢優化器和物理執行引擎,可以高性能地進行批量及流式處理。使用邏輯迴歸算法進行迭代計算,spark比hadoop速度快100多倍。 簡單易用 spar
相關文章
相關標籤/搜索