JAVA 多用戶商城系統b2b2c-kafka處理超大消息

時間 2019-12-13

標籤 java 多用戶商城系統 b2b2c kafka 處理超大消息欄目 Java 简体版

原文原文鏈接

Kafka設計的初衷是迅速處理短小的消息，通常10K大小的消息吞吐性能最好。但有時候，咱們須要處理更大的消息，好比XML文檔或JSON內容，一個消息差很少有10-100M，這種狀況下，Kakfa應該如何處理?java

須要JAVA Spring Cloud大型企業分佈式微服務雲構建的B2B2C電子商務平臺源碼一零三八七七四六二六算法

針對這個問題，有如下幾個建議：spring

最好的方法是不直接傳送這些大的數據。若是有共享存儲，如NAS, HDFS, S3等，能夠把這些大的文件存放到共享存儲，而後使用Kafka來傳送文件的位置信息。bash

第二個方法是，將大的消息數據切片或切塊，在生產端將數據切片爲10K大小，使用分區主鍵確保一個大消息的全部部分會被髮送到同一個kafka分區（這樣每一部分的拆分順序得以保留），如此以來，當消費端使用時會將這些部分從新還原爲原始的消息。服務器

第三，Kafka的生產端能夠壓縮消息，若是原始消息是XML，當經過壓縮以後，消息可能會變得不那麼大。在生產端的配置參數中使用compression.codec和commpressed.topics能夠開啓壓縮功能，壓縮算法可使用GZip或Snappy。session

不過若是上述方法都不是你須要的，而你最終仍是但願傳送大的消息，那麼，則能夠在kafka中設置下面一些參數：mybatis

broker 配置:mvc

message.max.bytes (默認:1000000) –app

broker能接收消息的最大字節數，這個值應該比消費端的fetch.message.max.bytes更小纔對，不然broker就會由於消費端沒法使用這個消息而掛起。分佈式

log.segment.bytes (默認: 1GB) –

kafka數據文件的大小，確保這個數值大於一個消息的長度。通常說來使用默認值便可（通常一個消息很難大於1G，由於這是一個消息系統，而不是文件系統）。

replica.fetch.max.bytes (默認: 1MB) –

broker可複製的消息的最大字節數。這個值應該比message.max.bytes大，不然broker會接收此消息，但沒法將此消息複製出去，從而形成數據丟失。

consumer 配置:

fetch.message.max.bytes (默認 1MB) – 消費者能讀取的最大消息。這個值應該大於或等於message.max.bytes。

因此，若是你必定要選擇kafka來傳送大的消息，還有些事項須要考慮。要傳送大的消息，不是當出現問題以後再來考慮如何解決，而是在一開始設計的時候，就要考慮到大消息對集羣和主題的影響。

性能: 根據前面提到的性能測試，kafka在消息爲10K時吞吐量達到最大，更大的消息會下降吞吐量，在設計集羣的容量時，尤爲要考慮這點。

可用的內存和分區數：Brokers會爲每一個分區分配replica.fetch.max.bytes參數指定的內存空間，假設replica.fetch.max.bytes=1M，且有1000個分區，則須要差很少1G的內存，確保分區數的最大的消息不會超過服務器的內存，不然會報OOM錯誤。一樣地，消費端的fetch.message.max.bytes指定了最大消息須要的內存空間，一樣，分區數*最大須要內存空間不能超過服務器的內存。因此，若是你有大的消息要傳送，則在內存必定的狀況下，只能使用較少的分區數或者使用更大內存的服務器。

垃圾回收：到如今爲止，我在kafka的使用中還沒發現過此問題，但這應該是一個須要考慮的潛在問題。更大的消息會讓GC的時間更長（由於broker須要分配更大的塊），隨時關注GC的日誌和服務器的日誌信息。若是長時間的GC致使kafka丟失了zookeeper的會話，則須要配置zookeeper.session.timeout.ms參數爲更大的超時時間。一切的一切，都須要在權衡利弊以後，再決定選用哪一個最合適的方案。

參考配置以下：

replica.fetch.max.bytes=4194304
message.max.bytes=4000000
compression.codec=snappy
max.partition.fetch.bytes=4194304
複製代碼

java B2B2C springmvc mybatis仿淘寶電子商城系統

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。