理解Spark之一——stage劃分

時間 2021-01-11

欄目 Spark 简体版

原文原文鏈接

我們首先知道Spark的基本執行流程，簡化來說，當提交一個Spark程序，HDFS上的每個Block對應一個分區、一個Task任務，這個Task任務就是在跑我們開發是Spark程序，程序中是我們使用的一個個算子。在算子中，又可以劃分成爲兩種，一種是寬依賴、一種是窄依賴，它們和stage的關係就是寬依賴是劃分stage的邊界，窄依賴並不會劃分stage。那麼爲什麼需要stage這個

>>阅读原文<<

相關文章

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<