Cross-Platform Resource Scheduling for Spark and MapReduce on YARN論文理解

Cross-Platform Resource Scheduling for Spark and MapReduce on YARN論文理解 摘要 MapReduce不能有效的處理大數據的非批處理過程(例:交互式作業,實時查詢和流計算);新興的Apache Spark則可以處理這一過程,Spark可以在已建立的Hadoop集羣上運行並利用現有的HDFS。 在YARN上部署Spark的三個主要挑戰
相關文章
相關標籤/搜索