學習筆記-spark

概念 RDD: 彈性分佈式數據集(由分區組成),每個分區在不同節點上 job:在裏面可以看到當前應用分析出來的所有任務,以及所有的excutors中action的執行時間。 stage:在裏面可以看到應用的所有stage,stage是按照寬依賴來區分的,因此粒度上要比job更細一些。從作業調度角度展示調度的階段和任務的完成裝填 storage:我們所做的cache persist等操作,都會在這裏
相關文章
相關標籤/搜索