Spark入門:實現WordCount的3種方式

WordCount作爲Spark的入門任務,可以很簡單,也可以做到比較複雜。 本文從實現功能的角度提出了3種實現方式,至於性能影響,會在後文繼續討論。 注意: 本文使用的Spark版本還是1.6.1.如果讀者您已經切換到2.0+版本,請參考GitHub spark的官方例子進行學習。 因爲2.0版本的API與1.X 並不能完全兼容,特別是2.0開始使用了SparkSession的概念,而不是Spa
相關文章
相關標籤/搜索