一、緣起
什么是session?服務器為每個用戶創(chuàng)建一個會話,存儲用戶的相關(guān)信息,以便多次請求能夠定位到同一個上下文。
Web開發(fā)中,web-server可以自動為同一個瀏覽器的訪問用戶自動創(chuàng)建session,提供數(shù)據(jù)存儲功能。最常見的,會把用戶的登錄信息、用戶信息存儲在session中,以保持登錄狀態(tài)。
什么是session一致性問題?只要用戶不重啟瀏覽器,每次http短連接請求,理論上服務端都能定位到session,保持會話。
當只有一臺web-server提供服務時,每次http短連接請求,都能夠正確路由到存儲session的對應web-server(廢話,因為只有一臺)。
此時的web-server是無法保證高可用的,采用“冗余+故障轉(zhuǎn)移”的
多臺web-server來保證高可用時,每次http短連接請求就不一定能路由到正確的session了。
如上圖,假設(shè)用戶包含登錄信息的session都記錄在第一臺web-server上,反向代理如果將請求路由到另一臺web-server上,可能就找不到相關(guān)信息,而導致用戶需要重新登錄。
在web-server高可用時,如何保證session路由的一致性,是今天將要討論的問題。
二、session同步法
思路:
多個web-server之間相互同步session,這樣每個web-server之間都包含全部的session
優(yōu)點:web-server支持的功能,
應用程序不需要修改代碼不足:
?session的同步需要數(shù)據(jù)傳輸,
占內(nèi)網(wǎng)帶寬,有時延
?所有web-server都包含所有session數(shù)據(jù),數(shù)據(jù)量
受內(nèi)存限制,無法水平擴展?
有更多web-server時要歇菜三、客戶端存儲法
思路:服務端存儲所有用戶的session,內(nèi)存占用較大,可以
將session存儲到瀏覽器cookie中,每個端只要存儲一個用戶的數(shù)據(jù)了
優(yōu)點:
服務端不需要存儲缺點:
?每次http請求都攜帶session,
占外網(wǎng)帶寬?數(shù)據(jù)存儲在端上,并在網(wǎng)絡傳輸,存在泄漏、篡改、竊取等
安全隱患?session
存儲的數(shù)據(jù)大小受cookie限制“端存儲”的方案雖然不常用,但確實是一種思路。
三、反向代理hash一致性
思路:web-server為了保證高可用,有多臺冗余,反向代理層能不能做一些事情,讓
同一個用戶的請求保證落在一臺web-server上呢?
方案一:四層代理hash反向代理層使用用戶ip來做hash,以保證同一個ip的請求落在同一個web-server上
方案二:七層代理hash反向代理使用http協(xié)議中的
某些業(yè)務屬性來做hash,例如sid,city_id,user_id等,能夠更加靈活的實施hash策略,以保證同一個瀏覽器用戶的請求落在同一個web-server上
優(yōu)點:
?只需要改nginx配置,
不需要修改應用代碼?
負載均衡,只要hash屬性是均勻的,多臺web-server的負載是均衡的
?可以
支持web-server水平擴展(session同步法是不行的,受內(nèi)存限制)
不足:
?
如果web-server重啟,一部分session會丟失,產(chǎn)生業(yè)務影響,例如部分用戶重新登錄
?如果web-server水平擴展,
rehash后session重新分布,也會有一部分用戶路由不到正確的sessionsession一般是有有效期的,所有不足中的兩點,可以認為等同于部分session失效,一般問題不大。
對于四層hash還是七層hash,個人推薦前者:
讓專業(yè)的軟件做專業(yè)的事情,反向代理就負責轉(zhuǎn)發(fā),盡量不要引入應用層業(yè)務屬性,除非不得不這么做(例如,有時候多機房多活需要按照業(yè)務屬性路由到不同機房的web-server)。
四、后端統(tǒng)一存儲
思路:
將session存儲在web-server后端的存儲層,數(shù)據(jù)庫或者緩存
優(yōu)點:
?
沒有安全隱患?
可以水平擴展,數(shù)據(jù)庫/緩存水平切分即可
?web-server重啟或者擴容都
不會有session丟失不足:增加了一次網(wǎng)絡調(diào)用,并且
需要修改應用代碼對于db存儲還是cache,個人推薦后者:session讀取的頻率會很高,數(shù)據(jù)庫壓力會比較大。如果有session高可用需求,cache可以做高可用,但大部分情況下session可以丟失,一般也不需要考慮高可用。
五、總結(jié)
保證session一致性的架構(gòu)設(shè)計常見方法:
?
session同步法:多臺web-server相互同步數(shù)據(jù)
?
客戶端存儲法:一個用戶只存儲自己的數(shù)據(jù)
?
反向代理hash一致性:四層hash和七層hash都可以做,保證一個用戶的請求落在一臺web-server上
?
后端統(tǒng)一存儲:web-server重啟和擴容,session也不會丟失
對于方案3和方案4,個人建議推薦后者:
?
web層、service層無狀態(tài)是大規(guī)模分布式系統(tǒng)設(shè)計原則之一,session屬于狀態(tài),不宜放在web層
?
讓專業(yè)的軟件做專業(yè)的事情,web-server存session?還是讓cache去做這樣的事情吧
更多建議: