Kafka 是主流的消息流系統(tǒng),其中的概念還是比較多的,下面通過圖示的方式來梳理一下 Kafka 的核心概念,以便在我們的頭腦中有一個清晰的認識。
基礎(chǔ)
Kafka 是一套流處理系統(tǒng),可以讓后端服務(wù)輕松的相互溝通,是微服務(wù)架構(gòu)中常用的組件。

生產(chǎn)者消費者
生產(chǎn)者服務(wù) Producer 向 Kafka 發(fā)送消息,消費者服務(wù) Consumer 監(jiān)聽 Kafka 接收消息。

一個服務(wù)可以同時為生產(chǎn)者和消費者。

Topics 主題
Topic 是生產(chǎn)者發(fā)送消息的目標地址,是消費者的監(jiān)聽目標。

一個服務(wù)可以監(jiān)聽、發(fā)送多個 Topics。

Kafka 中有一個【consumer-group(消費者組)】的概念。這是一組服務(wù),扮演一個消費者。

如果是消費者組接收消息,Kafka 會把一條消息路由到組中的某一個服務(wù)。

這樣有助于消息的負載均衡,也方便擴展消費者。Topic 扮演一個消息的隊列。首先,一條消息發(fā)送了。

然后,這條消息被記錄和存儲在這個隊列中,不允許被修改。

接下來,消息會被發(fā)送給此 Topic 的消費者。但是,這條消息并不會被刪除,會繼續(xù)保留在隊列中。

繼續(xù)發(fā)送消息。

像之前一樣,這條消息會發(fā)送給消費者、不允許被改動、一直呆在隊列中。(消息在隊列中能呆多久,可以修改 Kafka 的配置)


Partitions 分區(qū)
上面 Topic 的描述中,把 Topic 看做了一個隊列,實際上,一個 Topic 是由多個隊列組成的,被稱為【Partition(分區(qū))】。這樣可以便于 Topic 的擴展。

生產(chǎn)者發(fā)送消息的時候,這條消息會被路由到此 Topic 中的某一個 Partition。

消費者監(jiān)聽的是所有分區(qū)。

生產(chǎn)者發(fā)送消息時,默認是面向 Topic 的,由 Topic 決定放在哪個 Partition,默認使用輪詢策略。

也可以配置 Topic,讓同類型的消息都在同一個 Partition。例如,處理用戶消息,可以讓某一個用戶所有消息都在一個 Partition。例如,用戶1發(fā)送了3條消息:A、B、C,默認情況下,這3條消息是在不同的 Partition 中(如 P1、P2、P3)。在配置之后,可以確保用戶1的所有消息都發(fā)到同一個分區(qū)中(如 P1)。

這個功能有什么用呢?這是為了提供消息的【有序性】。消息在不同的 Partition 是不能保證有序的,只有一個 Partition 內(nèi)的消息是有序的。


架構(gòu)
Kafka 是集群架構(gòu)的,ZooKeeper是重要組件。

ZooKeeper 管理者所有的 Topic 和 Partition。Topic 和 Partition 存儲在 Node 物理節(jié)點中,ZooKeeper負責維護這些 Node。

例如,有2個 Topic,各自有2個 Partition。

這是邏輯上的形式,但在 Kafka 集群中的實際存儲可能是這樣的:

Topic A 的 Partition #1 有3份,分布在各個 Node 上。這樣可以增加 Kafka 的可靠性和系統(tǒng)彈性。3個 Partition #1 中,ZooKeeper 會指定一個 Leader,負責接收生產(chǎn)者發(fā)來的消息。

其他2個 Partition #1 會作為 Follower,Leader 接收到的消息會復(fù)制給 Follower。

這樣,每個 Partition 都含有了全量消息數(shù)據(jù)。

即使某個 Node 節(jié)點出現(xiàn)了故障,也不用擔心消息的損壞。Topic A 和 Topic B 的所有 Partition 分布可能就是這樣的:

感謝閱讀,希望對你有所幫助 :) 翻譯整理自:https://timothystepro.medium.com/visualizing-kafka-20bc384803e7譯文:https://blog.csdn.net/duysh/article/details/116355977
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。