Kafka源代碼閱讀(5):stream

線程模型

kafka stream默認是單線程的。
這裏寫圖片描述
如果啓動多線程
這裏寫圖片描述
kafka 的基本調度單位是task。每一個task包含着一個完整子topo。這點和Storm不同。一個線程可以包含多個task。
每一個task擁有自己的state store。用於幫助kafka stream進行有狀態的數據處理。state store以topic的方式存儲在broker端。

概念

KStream和KTable只能從kafka topic中創造。