spark部分:spark的四種運行模式,Spark 比 MapReduce 快的原因,spark執行程序流程,spark算子種類,spark持久化算子,cache 和 persist,調節參數的方式

Spark 有 4 中運行模式: 1. local 模式,適用於測試 2. standalone,並非是單節點,而是使用 spark 自帶的資源調度框架 3. yarn,最流行的方式,使用 yarn 集羣調度資源 4. mesos,國外使用的多 Spark 比 MapReduce 快的原因 1. Spark 基於內存迭代,而 MapReduce 基於磁盤迭代 MapReduce 的設計:中間結果保
相關文章
相關標籤/搜索