Spark體系概況

一、Spark來源 Spark依託於Hadoop,原有的Hadoop在剛發佈是非常完善的,但隨着對Hadoop的深入使用,發現存在許多問題。Hadoop最早的版本是MRv1版本,任務的提交和調度如下。 可知Hadoop主要分成3個主要部分,HDFS提供數據源,JobTrack負責任務的資源分配管理以及任務的調度,TaskTrack主要負責任務的執行。當集羣任務較多,JobTrack會出現負載過重,
相關文章
相關標籤/搜索