SparkStreaming 根據指定字段進行去重,並保留時間爲最新的那條記錄(消費Kafka版本爲 0.10)

// 對數據進行過濾,取時間爲最新的那條記錄 val inputFilterIterable: RDD[(String, String)] = inputFeedRDD.map(inputRDD => { val a: ConsumerRecord[String, String] = inputRDD val inputString: S
相關文章
相關標籤/搜索