RDD之collect方法執行的過程

首先來看一張圖: spark集羣中有master節點和Worker節點,master節點負責任務調度,worker節點負責計算。 當集羣啓動時,worker節點會向master註冊,並且定期向master發送心跳。 當我們向集羣提交任務時,會啓動一個進程spark-submit,這個進程也叫做driver。這個進程先要連接master,然後master會通過註冊信息找到合適的worker節點去計算
相關文章
相關標籤/搜索