Kafka 的一些知識點整理【1】

時間 2019-12-01

標籤 kafka 一些知識整理欄目 Kafka 简体版

原文原文鏈接

First: Kafka 是什麼？java

Kafka 是一個發佈訂閱系統最初是是LinkedIn 開發最後交給Apache 開源組織 github地址：https://github.com/apache/kafka 是用java 和Scala 去開發的~mysql

Kafka 如今主要用於消息隊列使用git

Kafka 是一個快速可擴展內在就是分佈式的系統 github

分佈式: Kafka 提供集羣服務 Kafka cluster 能夠由一個或者多個Broker 組成每一個Broker 提供對客戶端的服務 redis

分區：每一類消息或者叫訂閱主體 topic 能夠有不少分區 Partition sql

複製：一個topic 的分區有多個副本，按照必定的規則分佈在broker集羣中，副本可分爲leader和follow,leader所在broker負責響應客戶端的讀寫請求，follow週期性地同步leader數據，已防止leader故障後消息丟失apache

常見的術語有哪些服務器

Broker ：架構

Kafka集羣包含一個或多個服務器，這種服務器被稱爲broker。broker端不維護數據的消費狀態，提高了性能。直接使用磁盤進行存儲，線性讀寫，速度快：避免了數據在JVM內存和系統內存之間的複製，減小耗性能的建立對象和垃圾回收分佈式

Topic && Partition :

Topic 是指消息發送的服務器的類別消費着用此類別去訂閱消息好比我訂閱的是蘇州日報仍是人民日報等此意思，topic 可存在於一個或者多個broker 中消費者不用關心存儲在那個broker 中就像咱們網上買東西咱們不關心這個東西存在那個物流倉庫裏面反正會有快遞員給我送過來~

每一個topic 會有存一個或者多個Partition 中每一個Partition 都能保證有序 Partition 物理地址中對應的是一個文件夾文件夾中這個目錄下有兩類文件，一類是以log爲後綴的文件，另外一類是以index爲後綴的文件每個log文件和一個index文件相對應，這一對文件就是一個Segment File，其中的log文件就是數據文件，裏面存放的就是Message，而index文件是索引文件。Index文件記錄了元數據信息，指向對應的數據文件中Message的物理偏移量。

Partition 的存在線性的提升的kafka的吞吐效率

Topic 是一個邏輯概念最終真正的物理實現是partition 當建立topic 的時候會指定partition的數量數量越大其吞吐能力越強可是也越消耗資源

Producer:

發佈消息到Kafka Broke

Consumer && Consumer Group:

Consumer:消息的消費者，從Kafka Broker中拉取消息的客戶端

每一個Consumer屬於一個特定的Consumer Group（可爲每一個Consumer指定group name，若不指定group name則屬於默認的group）

每一個Partition 只會被Consumer Group中的一個Consumer 順序消費每一個Consumer Group 中的一個Consumer 會消費一個或者多個Partition

因此設置topic 中的Pattition 的數量要根據 Consumer Group 中的consumer 作參考通常是相等若是Consumer group 的數量大於訂閱的topic 中的partition 數量多致使其中一個consumer 無法消費數據