問題:apache
一、線上IM頭等倉讀取不出來,通過排查,發現是kafka消費出現了問題數組
二、目前使用的版本 kafka_2.11-0.9.0.1 線程
三、核心參數: Topic 設置了30個Partition,消費組設置了10個線程日誌
四、故障表象爲:消費組中有3個Partition卡住不消費了,如圖:get
五、繼續排查kafka borken是否正常,查詢線上5臺kafka的日誌,發現有錯誤日誌kafka
六、發現有數組下標越界的狀況,查閱了一下官方,發現這是一個在 kafka_2.11-0.9.0.1 這個版本里一個已知問題,預計在0.10 .0.0 修復it
https://issues.apache.org/jira/browse/KAFKA-3593io
七、2017-09-08 升級 kafka版本到 kafka_2.11-0.10.0.0 解決了這個問題,kafka不報數組下標越界了im
總結:此問題不是必現問題,在某種場景下可復現,後續須要繼續關注該問題總結