一、web-server的負(fù)載均衡

互聯(lián)網(wǎng)架構(gòu)中,web-server接入一般使用nginx來(lái)做反向代理,實(shí)施負(fù)載均衡。整個(gè)架構(gòu)分三層:
- 上游調(diào)用層,一般是browser或者APP
- 中間反向代理層,nginx
- 下游真實(shí)接入集群,web-server,常見web-server的有tomcat,apache
整個(gè)訪問過(guò)程為:
- browser向daojia.com發(fā)起請(qǐng)求
- DNS服務(wù)器將daojia.com解析為外網(wǎng)IP(1.2.3.4)
- browser通過(guò)外網(wǎng)IP(1.2.3.4)訪問nginx
- nginx實(shí)施負(fù)載均衡策略,常見策略有輪詢,隨機(jī),IP-hash等
- nginx將請(qǐng)求轉(zhuǎn)發(fā)給內(nèi)網(wǎng)IP(192.168.0.1)的web-server
由于
http短連接,以及web應(yīng)用無(wú)狀態(tài)的特性,理論上
任何一個(gè)http請(qǐng)求落在任意一臺(tái)web-server都應(yīng)該得到正常處理(如果必須落在一臺(tái),說(shuō)明架構(gòu)不合理,不能水平擴(kuò)展)。
問題來(lái)了,
tcp是有狀態(tài)的連接,客戶端和服務(wù)端一旦建立連接,
一個(gè)client發(fā)起的請(qǐng)求必須落在同一臺(tái)tcp-server上,此時(shí)如何做負(fù)載均衡,如何保證水平擴(kuò)展呢?
二、單機(jī)法tcp-server

單個(gè)tcp-server顯然是可以保證請(qǐng)求一致性:
- client向tcp.daojia.com發(fā)起tcp請(qǐng)求
- DNS服務(wù)器將tcp.daojia.com解析為外網(wǎng)IP(1.2.3.4)
- client通過(guò)外網(wǎng)IP(1.2.3.4)向tcp-server發(fā)起請(qǐng)求
方案的缺點(diǎn)?
無(wú)法保證高可用。
三、集群法tcp-server

通過(guò)搭建tcp-server集群來(lái)保證高可用,客戶端來(lái)實(shí)現(xiàn)負(fù)載均衡:
- client內(nèi)配置有tcp1/tcp2/tcp3.daojia.com三個(gè)tcp-server的外網(wǎng)IP
- 客戶端通過(guò)“隨機(jī)”的方式選擇tcp-server,假設(shè)選擇到的是tcp1.daojia.com
- 通過(guò)DNS解析tcp1.daojia.com
- 通過(guò)外網(wǎng)IP連接真實(shí)的tcp-server
如何保證高可用呢?
如果client發(fā)現(xiàn)某個(gè)tcp-server連接不上,則選擇另一個(gè)。
潛在的缺點(diǎn)?
每次連接前,需要多實(shí)施一次DNS訪問:
- 難以預(yù)防DNS劫持
- 多一次DNS訪問意味著更長(zhǎng)的連接時(shí)間,這個(gè)不足在手機(jī)端更為明顯
如何解決DNS的問題?
直接將IP配置在客戶端,可以解決上述兩個(gè)問題,很多公司也就是這么做的(俗稱“IP直通車”)。
“IP直通車”有什么新問題?
將IP寫死在客戶端,在客戶端實(shí)施負(fù)載均衡,擴(kuò)展性很差:
- 如果原有IP發(fā)生變化,客戶端得不到實(shí)時(shí)通知
- 如果新增IP,即tcp-sever擴(kuò)容,客戶端也得不到實(shí)時(shí)通知
- 如果負(fù)載均衡策略變化,需要升級(jí)客戶端
四、服務(wù)端實(shí)施負(fù)載均衡
只有將復(fù)雜的策略下沉到服務(wù)端,才能根本上解決擴(kuò)展性的問題。

增加一個(gè)http接口,將客戶端的“IP配置”與“均衡策略”放到服務(wù)端是一個(gè)不錯(cuò)的方案:
- client每次訪問tcp-server前,先調(diào)用一個(gè)新增的get-tcp-ip接口,對(duì)于client而言,這個(gè)http接口只返回一個(gè)tcp-server的IP
- 這個(gè)http接口,實(shí)現(xiàn)的是原client的IP均衡策略
- 拿到tcp-server的IP后,和原來(lái)一樣向tcp-server發(fā)起TCP長(zhǎng)連接
這樣的話,擴(kuò)展性問題就解決了:
- 如果原有IP發(fā)生變化,只需要修改get-tcp-ip接口的配置
- 如果新增IP,也是修改get-tcp-ip接口的配置
- 如果負(fù)載均衡策略變化,需要升級(jí)客戶端
然而,
新的問題又產(chǎn)生了,如果所有IP放在客戶端,當(dāng)有一個(gè)IP掛掉的時(shí)候,client可以再換一個(gè)IP連接,保證可用性,而get-tcp-ip接口只是維護(hù)靜態(tài)的tcp-server集群IP,對(duì)于這些
IP對(duì)應(yīng)的tcp-server是否可用,是完全不知情的,怎么辦呢?
五、tcp-server狀態(tài)上報(bào)

get-tcp-ip接口怎么知道tcp-server集群中各臺(tái)服務(wù)器是否可用呢,
tcp-server主動(dòng)上報(bào)是一個(gè)潛在方案,如果某一個(gè)tcp-server掛了,則會(huì)終止上報(bào),對(duì)于停止上報(bào)狀態(tài)的tcp-server,get-tcp-ip接口,將不返回給client相應(yīng)的tcp-server的外網(wǎng)IP。
該設(shè)計(jì)的存在的問題?
誠(chéng)然,狀態(tài)上報(bào)解決了tcp-server高可用的問題,但這個(gè)設(shè)計(jì)犯了一個(gè)“反向依賴”的耦合小錯(cuò)誤:使得tcp-server要依賴于一個(gè)與本身業(yè)務(wù)無(wú)關(guān)的web-server。
六、tcp-server狀態(tài)拉取
更優(yōu)的方案是:
web-server通過(guò)“拉”的方式獲取各個(gè)tcp-server的狀態(tài),而不是tcp-server通過(guò)“推”的方式上報(bào)自己的狀態(tài)。
這樣的話,
每個(gè)tcp-server都獨(dú)立與解耦,只需專注于資深的tcp業(yè)務(wù)功能即可。
高可用、負(fù)載均衡、擴(kuò)展性等任務(wù)
由get-tcp-ip的web-server專注來(lái)執(zhí)行。
多說(shuō)一句,將負(fù)載均衡實(shí)現(xiàn)在服務(wù)端,還有一個(gè)好處,可以實(shí)現(xiàn)異構(gòu)tcp-server的負(fù)載均衡,以及過(guò)載保護(hù):
- 靜態(tài)實(shí)施:web-server下的多個(gè)tcp-server的IP可以配置負(fù)載權(quán)重,根據(jù)tcp-server的機(jī)器配置分配負(fù)載(nginx也有類似的功能)
- 動(dòng)態(tài)實(shí)施:web-server可以根據(jù)“拉”回來(lái)的tcp-server的狀態(tài),動(dòng)態(tài)分配負(fù)載,并在tcp-server性能極具下降時(shí)實(shí)施過(guò)載保護(hù)
七、總結(jié)
web-server如何實(shí)施負(fù)載均衡?
利用nginx反向代理來(lái)輪詢、隨機(jī)、ip-hash。
tcp-server怎么快速保證請(qǐng)求一致性?
單機(jī)。
如何保證高可用?
客戶配置多個(gè)tcp-server的域名。
如何防止DNS劫持,以及加速?
IP直通車,客戶端配置多個(gè)tcp-server的IP。
如何保證擴(kuò)展性?
服務(wù)端提供get-tcp-ip接口,向client屏屏蔽負(fù)載均衡策略,并實(shí)施便捷擴(kuò)容。
如何保證高可用?
tcp-server“推”狀態(tài)給get-tcp-ip接口,
or
get-tcp-ip接口“拉”tcp-server狀態(tài)。
細(xì)節(jié)重要,思路比細(xì)節(jié)更重要
更多建議: