SparkStreaming——基於Kafka消費到HBase的順序問題

線上設置的Kafka默認配置是3個Partition,設我們傳遞的數據是用戶的信息如下 用戶id 用戶名 具體信息 動作 001 zhangsan … 插入 001 zhangsan … 修改 001 zhangsan … 刪除 002 lisi … 插入 生產者分別向不同的主Partition發送數據,消費者每5秒去消費數據,因爲Kafka是全局無序且局部數據有序,所以可能會出現的結果是這樣的:
相關文章
相關標籤/搜索