PySpark學習

一、RDD建立:數組 (1)從文件系統中加載數據建立RDD緩存 lines = sc.textFile("file:///usr/local/spark/mycode/rdd/word.txt")函數 (2)從HDFS中讀取並加載數據oop >>> lines = sc.textFile("hdfs://localhost:9000/user/hadoop/word.txt")spa >>> li
相關文章
相關標籤/搜索