session一致性架構(gòu)設(shè)計實踐

2018-09-09 14:14 更新

一、緣起

什么是session?
服務器為每個用戶創(chuàng)建一個會話,存儲用戶的相關(guān)信息,以便多次請求能夠定位到同一個上下文。

Web開發(fā)中,web-server可以自動為同一個瀏覽器的訪問用戶自動創(chuàng)建session,提供數(shù)據(jù)存儲功能。最常見的,會把用戶的登錄信息、用戶信息存儲在session中,以保持登錄狀態(tài)。

什么是session一致性問題?
只要用戶不重啟瀏覽器,每次http短連接請求,理論上服務端都能定位到session,保持會話。
session一致性
當只有一臺web-server提供服務時,每次http短連接請求,都能夠正確路由到存儲session的對應web-server(廢話,因為只有一臺)。

此時的web-server是無法保證高可用的,采用“冗余+故障轉(zhuǎn)移”的多臺web-server來保證高可用時,每次http短連接請求就不一定能路由到正確的session了。
session一致性2
如上圖,假設(shè)用戶包含登錄信息的session都記錄在第一臺web-server上,反向代理如果將請求路由到另一臺web-server上,可能就找不到相關(guān)信息,而導致用戶需要重新登錄。

在web-server高可用時,如何保證session路由的一致性,是今天將要討論的問題。

二、session同步法

session同步法
思路多個web-server之間相互同步session,這樣每個web-server之間都包含全部的session

優(yōu)點:web-server支持的功能,應用程序不需要修改代碼

不足
?session的同步需要數(shù)據(jù)傳輸,內(nèi)網(wǎng)帶寬,有時延
?所有web-server都包含所有session數(shù)據(jù),數(shù)據(jù)量受內(nèi)存限制,無法水平擴展
?有更多web-server時要歇菜

三、客戶端存儲法

客戶端存儲法
思路:服務端存儲所有用戶的session,內(nèi)存占用較大,可以將session存儲到瀏覽器cookie中,每個端只要存儲一個用戶的數(shù)據(jù)了

優(yōu)點服務端不需要存儲

缺點
?每次http請求都攜帶session,外網(wǎng)帶寬
?數(shù)據(jù)存儲在端上,并在網(wǎng)絡傳輸,存在泄漏、篡改、竊取等安全隱患
?session存儲的數(shù)據(jù)大小受cookie限制

“端存儲”的方案雖然不常用,但確實是一種思路。

三、反向代理hash一致性

思路:web-server為了保證高可用,有多臺冗余,反向代理層能不能做一些事情,讓同一個用戶的請求保證落在一臺web-server上呢?
反向代理hash一致性
方案一:四層代理hash

反向代理層使用用戶ip來做hash,以保證同一個ip的請求落在同一個web-server上

反向代理hash一致性2

方案二:七層代理hash
反向代理使用http協(xié)議中的某些業(yè)務屬性來做hash,例如sid,city_id,user_id等,能夠更加靈活的實施hash策略,以保證同一個瀏覽器用戶的請求落在同一個web-server上

優(yōu)點
?只需要改nginx配置,不需要修改應用代碼
?負載均衡,只要hash屬性是均勻的,多臺web-server的負載是均衡的
?可以支持web-server水平擴展(session同步法是不行的,受內(nèi)存限制)

不足
?如果web-server重啟,一部分session會丟失,產(chǎn)生業(yè)務影響,例如部分用戶重新登錄
?如果web-server水平擴展,rehash后session重新分布,也會有一部分用戶路由不到正確的session

session一般是有有效期的,所有不足中的兩點,可以認為等同于部分session失效,一般問題不大。

對于四層hash還是七層hash,個人推薦前者讓專業(yè)的軟件做專業(yè)的事情,反向代理就負責轉(zhuǎn)發(fā),盡量不要引入應用層業(yè)務屬性,除非不得不這么做(例如,有時候多機房多活需要按照業(yè)務屬性路由到不同機房的web-server)。

四、后端統(tǒng)一存儲

后端統(tǒng)一存儲
思路將session存儲在web-server后端的存儲層,數(shù)據(jù)庫或者緩存

優(yōu)點
?沒有安全隱患
?可以水平擴展,數(shù)據(jù)庫/緩存水平切分即可
?web-server重啟或者擴容都不會有session丟失

不足:增加了一次網(wǎng)絡調(diào)用,并且需要修改應用代碼

對于db存儲還是cache,個人推薦后者:session讀取的頻率會很高,數(shù)據(jù)庫壓力會比較大。如果有session高可用需求,cache可以做高可用,但大部分情況下session可以丟失,一般也不需要考慮高可用。

五、總結(jié)

保證session一致性的架構(gòu)設(shè)計常見方法:
?session同步法:多臺web-server相互同步數(shù)據(jù)
?客戶端存儲法:一個用戶只存儲自己的數(shù)據(jù)
?反向代理hash一致性:四層hash和七層hash都可以做,保證一個用戶的請求落在一臺web-server上
?后端統(tǒng)一存儲:web-server重啟和擴容,session也不會丟失

對于方案3和方案4,個人建議推薦后者
?web層、service層無狀態(tài)是大規(guī)模分布式系統(tǒng)設(shè)計原則之一,session屬于狀態(tài),不宜放在web層
?讓專業(yè)的軟件做專業(yè)的事情,web-server存session?還是讓cache去做這樣的事情吧

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號