一、緣起
如《
消息總線消息必達》所述,MQ消息必達,架構(gòu)上有兩個核心設計點:
(1)消息落地
(2)消息超時、重傳、確認
再次回顧消息總線核心架構(gòu),它由
發(fā)送端、服務端、固化存儲、接收端四大部分組成。
為保證消息的可達性,超時、重傳、確認機制
可能導致消息總線、或者業(yè)務方收到重復的消息,從而對業(yè)務產(chǎn)生影響。
舉個栗子:
購買會員卡,
上游支付系統(tǒng)負責給用戶扣款,下游系統(tǒng)負責給用戶發(fā)卡,通過MQ異步通知。不管是上半場的ACK丟失,導致MQ收到重復的消息,還是下半場ACK丟失,導致購卡系統(tǒng)收到重復的購卡通知,都可能出現(xiàn),
上游扣了一次錢,下游發(fā)了多張卡。
消息總線的冪等性設計至關重要,是本文將要討論的重點。
二、上半場的冪等性設計
MQ消息發(fā)送上半場,即上圖中的1-3
1,發(fā)送端MQ-client將消息發(fā)給服務端MQ-server
2,服務端MQ-server將消息落地
3,服務端MQ-server回ACK給發(fā)送端MQ-client
如果
3丟失,發(fā)送端MQ-client超時后會重發(fā)消息,
可能導致服務端MQ-server收到重復消息。
此時
重發(fā)是MQ-client發(fā)起的,消息的處理是MQ-server,為了避免步驟2落地重復的消息,對每條消息,
MQ系統(tǒng)內(nèi)部必須生成一個inner-msg-id,作為去重和冪等的依據(jù),這個
內(nèi)部消息ID的特性是:
(1)全局唯一
(2)MQ生成,具備業(yè)務無關性,對消息發(fā)送方和消息接收方屏蔽
有了這個inner-msg-id,就能保證上半場重發(fā),也只有1條消息落到MQ-server的DB中,實現(xiàn)上半場冪等。三、下半場的冪等性設計
MQ消息發(fā)送下半場,即上圖中的4-6
4,服務端MQ-server將消息發(fā)給接收端MQ-client
5,接收端MQ-client回ACK給服務端
6,服務端MQ-server將落地消息刪除
需要強調(diào)的是,
接收端MQ-client回ACK給服務端MQ-server,是消息消費業(yè)務方的主動調(diào)用行為,不能由MQ-client自動發(fā)起,因為MQ系統(tǒng)不知道消費方什么時候真正消費成功。
如果
5丟失,服務端MQ-server超時后會重發(fā)消息,
可能導致MQ-client收到重復的消息。
此時重發(fā)是
MQ-server發(fā)起的,消息的處理是消息消費業(yè)務方,消息重發(fā)勢必導致業(yè)務方重復消費(上例中的一次付款,重復發(fā)卡),為了保證業(yè)務冪等性,
業(yè)務消息體中,必須有一個biz-id,作為去重和冪等的依據(jù),這個
業(yè)務ID的特性是:
(1)對于同一個業(yè)務場景,全局唯一
(2)由業(yè)務消息發(fā)送方生成,業(yè)務相關,對MQ透明
(3)由業(yè)務消息消費方負責判重,以保證冪等
最常見的業(yè)務ID有:支付ID,訂單ID,帖子ID等。
具體到支付購卡場景,發(fā)送方必須將支付ID放到消息體中,消費方必須對同一個支付ID進行判重,保證購卡的冪等。
有了這個業(yè)務ID,才能夠保證下半場消息消費業(yè)務方即使收到重復消息,也只有1條消息被消費,保證了冪等。三、總結(jié)
MQ為了保證消息必達,消息上下半場均可能發(fā)送重復消息,如何保證消息的冪等性呢?
上半場MQ-client生成inner-msg-id,保證上半場冪等。
這個ID全局唯一,業(yè)務無關,由MQ保證。
下半場業(yè)務發(fā)送方帶入biz-id,業(yè)務接收方去重保證冪等。
這個ID對單業(yè)務唯一,業(yè)務相關,對MQ透明。
結(jié)論:冪等性,不僅對MQ有要求,對業(yè)務上下游也有要求。
更多建議: