帶有狀態的SparkStreaming單詞計數程序

在另一篇《SparkStreaming的入門級程序:WordCount》文章中,只是統計每個批次的數據,是不帶狀態的單詞計數程序,使用的是reduceByKey()方法,它只能統計當前批次的單詞個數,而不會累加上一個批次的單詞個數;而帶有狀態的單詞計數程序會累加上個批次的單詞個數,它使用的則是updateStateByKey()方法。apache 在pom.xml文件中引入一下依賴:socket
相關文章
相關標籤/搜索