Spark API編程動手實戰-02-以集羣模式進行Spark API實戰textFile、cache、count

操作HDFS:先要保證HDFS啓動了: 啓動spark集羣: 以spark-shell運行在spark集羣上:   查看下之前上傳到HDFS上的」LICENSE.txt「文件: 用spark讀取這個文件: 使用count統計該文件的行數:  我們可以看到count 耗時爲0.239708s 對該RDD進行cache操作並執行count使得緩存生效: 執行count結果爲: 此時耗時爲0.21132
相關文章
相關標籤/搜索