Spark API編程動手實戰-02-以集羣模式進行Spark API實戰textFile、cache、count

時間 2021-01-12

標籤 DataNode cache count textFile saveAsTextFile 欄目 Spark 简体版

原文原文鏈接

操作HDFS：先要保證HDFS啓動了：啓動spark集羣：以spark-shell運行在spark集羣上：查看下之前上傳到HDFS上的」LICENSE.txt「文件：用spark讀取這個文件：使用count統計該文件的行數：我們可以看到count 耗時爲0.239708s 對該RDD進行cache操作並執行count使得緩存生效：執行count結果爲：此時耗時爲0.21132

>>阅读原文<<