《大數據計算引擎之Spark》一、基本原理

  前兩篇我們講了spark的基礎知識,包括spark的體系結構、執行框架、spark的基本數據類型以及spark中stage的劃分等等。本篇要介紹spark運行的原理。包括spark的內部執行機制,spark的基本數據類型RDD的執行流程。 1. Spark內部執行機制 1.1 內部執行流程 spark的內部執行機制在《spark基礎•下篇》已有介紹,此處再簡單介紹下。   如下圖1爲分佈式集羣
相關文章
相關標籤/搜索