第11課:完全解析wordcount運行原理

本期內容: 1. 從數據流動視角解密WordCount,即用Spark做單詞計數統計,數據究竟是怎麼流動的。 2. 從RDD依賴關係的視角解密WordCount。Spark中的一切操做皆RDD,後面的RDD對前面的RDD有依賴關係。 3. DAG與Lineage的思考。依賴關係會造成DAG。 1. 從數據流動視角解密WordCount (1)在IntelliJ IDEA中編寫下面代碼: packa
相關文章
相關標籤/搜索