重溫大數據---正兒八經Spark再探

連着把這一塊改總結的筆記都寫了,時間太緊張了,對不住各位了!😂😂😂 Spark RDD 彈性的分佈式數據集,可以理解爲一個Java類,裏面放的都是數據。RDD代表一個不可變的對元素分區的集合。並且RDD可以被並行計算。 Spark RDD特性 分爲若干個區 每個分片用一個函數計算 RDD直接是一個依賴關係 對於K-V的RDD可指定一個分區,告訴它如何分片 要運行的計算/執行最好在哪幾個機器上
相關文章
相關標籤/搜索