在Spark shell中基於HDFS文件系統進行wordcount交互式分析

Spark是一個分佈式內存計算框架,可部署在YARN或者MESOS管理的分佈式系統中(Fully Distributed),也可以以Pseudo Distributed方式部署在單個機器上面,還可以以Standalone方式部署在單個機器上面。運行Spark的方式有interactive和submit方式。本文中所有的操作都是以interactive方式操作以Standalone方式部署的Spar
相關文章
相關標籤/搜索