spark簡介(一)

spark是一個用於大規模數據處理的統一計算引擎。適用於各類各樣原先須要多種不一樣的分佈式平臺處理的場景,包括批處理、迭代計算、交互式查詢、流處理。經過統一的框架將各類處理流程整合到一塊兒。python spark特性web 快速性 spark經過使用先進的DAG調度器、查詢優化器和物理執行引擎,能夠高性能地進行批量及流式處理。使用邏輯迴歸算法進行迭代計算,spark比hadoop速度快100多倍
相關文章
相關標籤/搜索