用uid分庫(kù),uname上的查詢?cè)趺崔k?

2018-09-09 16:47 更新
1分鐘系列

【緣起】

用戶中心是幾乎每一個(gè)公司必備的基礎(chǔ)服務(wù),用戶注冊(cè)、登錄、信息查詢與修改都離不開用戶中心。

當(dāng)數(shù)據(jù)量越來(lái)越大時(shí),需要多用戶中心進(jìn)行水平切分。最常見的水平切分方式按照uid取模分庫(kù)
uid取模分庫(kù)
通過(guò)uid取模,將數(shù)據(jù)分布到多個(gè)數(shù)據(jù)庫(kù)實(shí)例上去,提高服務(wù)實(shí)例個(gè)數(shù),降低單庫(kù)數(shù)據(jù)量,以達(dá)到擴(kuò)容的目的。

水平切分之后:
uid訪問(wèn)直接定位
uid屬性上的查詢可以直接路由到庫(kù),如上圖,假設(shè)訪問(wèn)uid=124的數(shù)據(jù),取模后能夠直接定位db-user1。

對(duì)于uname上的查詢,就不能這么幸運(yùn)了:
uname訪問(wèn)遍歷庫(kù)
uname上的查詢,如上圖,假設(shè)訪問(wèn)uname=shenjian的數(shù)據(jù),由于不知道數(shù)據(jù)落在哪個(gè)庫(kù)上,往往需要遍歷所有庫(kù)【掃全庫(kù)法】,當(dāng)分庫(kù)數(shù)量多起來(lái),性能會(huì)顯著降低。

用uid分庫(kù),如何高效實(shí)現(xiàn)上的查詢,是本文將要討論的問(wèn)題。

【索引表法】

思路:uid能直接定位到庫(kù),uname不能直接定位到庫(kù),如果通過(guò)uname能查詢到uid,問(wèn)題解決
解決方案
1)建立一個(gè)索引表記錄uname->uid的映射關(guān)系
2)用uname來(lái)訪問(wèn)時(shí),先通過(guò)索引表查詢到uid,再定位相應(yīng)的庫(kù)
3)索引表屬性較少,可以容納非常多數(shù)據(jù),一般不需要分庫(kù)
4)如果數(shù)據(jù)量過(guò)大,可以通過(guò)uname來(lái)分庫(kù)
潛在不足:多一次數(shù)據(jù)庫(kù)查詢,性能下降一倍

【緩存映射法】

思路:訪問(wèn)索引表性能較低,把映射關(guān)系放在緩存里性能更佳
解決方案
1)uname查詢先到cache中查詢uid,再根據(jù)uid定位數(shù)據(jù)庫(kù)
2)假設(shè)cache miss,采用掃全庫(kù)法獲取uname對(duì)應(yīng)的uid,放入cache
3)uname到uid的映射關(guān)系不會(huì)變化,映射關(guān)系一旦放入緩存,不會(huì)更改,無(wú)需淘汰,緩存命中率超高
4)如果數(shù)據(jù)量過(guò)大,可以通過(guò)name進(jìn)行cache水平切分
潛在不足:多一次cache查詢

【uname生成uid】

思路:不進(jìn)行遠(yuǎn)程查詢,由uname直接得到uid
解決方案
1)在用戶注冊(cè)時(shí),設(shè)計(jì)函數(shù)uname生成uid,uid=f(uname),按uid分庫(kù)插入數(shù)據(jù)
2)用uname來(lái)訪問(wèn)時(shí),先通過(guò)函數(shù)計(jì)算出uid,即uid=f(uname)再來(lái)一遍,由uid路由到對(duì)應(yīng)庫(kù)
潛在不足:該函數(shù)設(shè)計(jì)需要非常講究技巧,有uid生成沖突風(fēng)險(xiǎn)

【uname基因融入uid】

思路:不能用uname生成uid,可以從uname抽取“基因”,融入uid中
uname基因融入uid
假設(shè)分8庫(kù),采用uid%8路由,潛臺(tái)詞是,uid的最后3個(gè)bit決定這條數(shù)據(jù)落在哪個(gè)庫(kù)上,這3個(gè)bit就是所謂的“基因”。

解決方案
1)在用戶注冊(cè)時(shí),設(shè)計(jì)函數(shù)uname生成3bit基因,uname_gene=f(uname),如上圖粉色部分
2)同時(shí),生成61bit的全局唯一id,作為用戶的標(biāo)識(shí),如上圖綠色部分
3)接著把3bit的uname_gene也作為uid的一部分,如上圖屎黃色部分
4)生成64bit的uid,由id和uname_gene拼裝而成,并按照uid分庫(kù)插入數(shù)據(jù)
5)用uname來(lái)訪問(wèn)時(shí),先通過(guò)函數(shù)由uname再次復(fù)原3bit基因,uname_gene=f(uname),通過(guò)uname_gene%8直接定位到庫(kù)

【總結(jié)】

業(yè)務(wù)場(chǎng)景:用戶中心,數(shù)據(jù)量大,通過(guò)uid分庫(kù)后,通過(guò)uname路由不到庫(kù)

解決方案
1)掃全庫(kù)法:遍歷所有庫(kù)
2)索引表法:數(shù)據(jù)庫(kù)中記錄uname->uid的映射關(guān)系
3)緩存映射法:緩存中記錄uname->uid的映射關(guān)系
4)uname生成uid
5)uname基因融入uid
以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)