在Java中的無死鎖同步實(shí)現(xiàn)方法分享！內(nèi)容解析！干貨分享！

巧克力終結(jié)者 2021-09-03 11:14:46 瀏覽數(shù) (2417)

反饋

線程同步是克服多線程程序中競爭條件的好工具。但是，它也有陰暗面。死鎖：難以發(fā)現(xiàn)、重現(xiàn)和修復(fù)的嚴(yán)重錯誤。防止它們發(fā)生的唯一可靠方法是正確設(shè)計(jì)您的代碼，這是本文的主題。我們將看看死鎖的起源，考慮一種發(fā)現(xiàn)現(xiàn)有代碼中潛在死鎖的方法，并提出設(shè)計(jì)無死鎖同步的實(shí)用方法。這些概念將通過一個簡單的演示項(xiàng)目進(jìn)行說明。

假設(shè)讀者已經(jīng)熟悉多線程編程，并且對 Java 中的線程同步原語有很好的理解。在接下來的部分中，我們不會區(qū)分同步語句和鎖 API，使用術(shù)語“鎖”來表示這兩種類型的可重入鎖，在示例中更喜歡前者。

一、死鎖機(jī)制

讓我們回顧一下死鎖是如何工作的。考慮以下兩種方法：

java：

void increment ({
synchronized(lock1) {
synchronized(lock2){
variablel ++;
}
}
}
void decrement ({
synchronized(lock2){
synchronized(lock1) {
variable--;
}
}}

這些方法被有意設(shè)計(jì)為產(chǎn)生死鎖。讓我們詳細(xì)考慮這是如何發(fā)生的。

increment() 和 decrement()基本上由以下5個步驟：

表格1

Step	increment()	decrement()
1	Acquire lock1	Acquire lock2
2	Acquire lock2	Acquire lock1
3	Perform increment	Perform decrement
4	Release lock2	Release lock1
5	Release lock1	Release lock2

假設(shè)有兩個并行線程，一個執(zhí)行increment()，另一個執(zhí)行decrement()。每個線程的步驟將按正常順序執(zhí)行，但是，如果我們將兩個線程放在一起考慮，一個線程的步驟將與另一個線程的步驟隨機(jī)交錯。隨機(jī)性來自系統(tǒng)線程調(diào)度程序強(qiáng)加的不可預(yù)測的延遲?？赡艿慕豢椖Ｊ交驁鼍胺浅６啵?zhǔn)確地說，有 252 種）并且可以分為兩組。第一組是其中一個線程足夠快以獲取兩個鎖（參見表 2）。顯然，這兩種方法中的第 1 步和第 2 步只有在相應(yīng)的鎖空閑時才能通過，否則，執(zhí)行線程將不得不等待它們的釋放。

表格2

No deadlock
Thread-1	Thread-2	Result
1: Acquire lock1		lock1 busy
2: Acquire lock2		lock2 busy
	1: Acquire lock2	wait for lock2 release
3: Perform increment	Waiting at lock2
4: Release lock2	Intercept lock2	lock2 changed owner
	2: Acquire lock1	wait for lock1 release
5: Release lock1	Intercept lock1	lock1 changed owner
	3: Perform decrement
	4: Release lock1	lock1 free
	5: Release lock2	lock2 free

在第二組中，兩個線程都成功獲取了鎖。結(jié)果見表3：該組中的所有案例均成功完成。

表格3

Deadlock
Thread-1	Thread-2	Result
1: Acquire lock1		lock1 busy
	1: Acquire lock2	Lock2 busy
2: Acquire lock2		wait for lock2 release
	2: Acquire lock1	wait for lock1 release
Waiting at lock2	Waiting at lock1
…	…

該組中的所有情況都會導(dǎo)致第一個線程等待第二個線程擁有的鎖，而第二個線程等待第一個線程擁有的鎖，因此兩個線程都無法進(jìn)一步進(jìn)行：

圖1

這是具有所有典型屬性的經(jīng)典死鎖情況。讓我們概述重要的：

至少有兩個線程，每個線程至少占用兩個鎖。
死鎖只發(fā)生在特定的線程時序組合中。
死鎖的發(fā)生取決于鎖定順序。

第二個屬性意味著死鎖不能隨意重現(xiàn)。此外，它們的再現(xiàn)性取決于操作系統(tǒng)、CPU 頻率、CPU 負(fù)載和其他因素。后者意味著軟件測試的概念不適用于死鎖，因?yàn)橄嗤拇a可能在一個系統(tǒng)上完美運(yùn)行而在另一個系統(tǒng)上失敗。因此，交付正確應(yīng)用程序的唯一方法是通過設(shè)計(jì)消除死鎖。這種設(shè)計(jì)有兩種基本方法，現(xiàn)在讓我們從更簡單的方法開始。

2. 粗粒度同步

從上面列表中的第一個屬性可以看出，如果我們的應(yīng)用程序中的任何線程都不允許同時持有多個鎖，則不會發(fā)生死鎖。好的，這聽起來像是一個計(jì)劃，但是我們應(yīng)該使用多少鎖以及將它們放在哪里？

最簡單和最直接的答案是用一個鎖保護(hù)所有事務(wù)。例如，為了保護(hù)一個復(fù)雜的數(shù)據(jù)對象，您可以將其所有公共方法聲明為同步的。這種方法用于?java.util.Hashtable?. 簡單的代價是由于缺乏并發(fā)而導(dǎo)致的性能損失，因?yàn)樗蟹椒ǘ际窍嗷プ枞摹?/p>

幸運(yùn)的是，在許多情況下，粗粒度同步可以以較少限制的方式執(zhí)行，從而允許一些并發(fā)和更好的性能。為了解釋它，我們應(yīng)該引入一個事務(wù)連接變量的概念。假設(shè)如果滿足兩個條件中的任何一個，則兩個變量在事務(wù)上連接：

存在涉及兩個變量的交易。
兩個變量都連接到第三個變量（傳遞性）。

因此，您首先以這樣一種方式對變量進(jìn)行分組，即同一組中的任何兩個變量都具有事務(wù)性連接，而不同組中的任何兩個變量都沒有。然后通過單獨(dú)的專用鎖保護(hù)每個組：

圖2

上面的解釋對于“transaction”和“involves”這兩個術(shù)語的確切含義來說有點(diǎn)短，但如果要準(zhǔn)確地解釋，那么解釋的篇文章就太長了，所以這篇文章只有留給讀者直覺和經(jīng)驗(yàn)。

這種高級粗粒度同步的一個很好的現(xiàn)實(shí)例子是?java.util.concurrent.ConcurrentHashMap?. 在這個對象內(nèi)部，有許多相同的數(shù)據(jù)結(jié)構(gòu)（“桶（buckets）”），每個?桶?都由自己的鎖保護(hù)。事務(wù)被分派到由鍵的哈希碼確定的存儲桶。因此，具有不同密鑰的事務(wù)大多會進(jìn)入不同的存儲桶，這使得它們可以并發(fā)執(zhí)行而不會犧牲線程安全性，由于存儲桶的事務(wù)獨(dú)立性，這是可能的。

但是，某些解決方案需要比粗粒度同步可以實(shí)現(xiàn)的更高級別的并發(fā)性。稍后，我們將考慮如何處理這個問題，但首先，我們需要介紹一種分析同步方案的有效方法。

3. 鎖定圖

假設(shè)您需要確定給定的代碼是否包含潛在的死鎖。讓我們稱這種任務(wù)為“同步分析”或“死鎖分析”。你會如何處理這個問題？

最有可能的是，您會嘗試對線程爭用鎖的所有可能場景進(jìn)行排序，試圖找出是否存在不良場景。在第 1 節(jié)中，我們采用了如此簡單的方法，結(jié)果發(fā)現(xiàn)場景太多了。即使在最簡單的情況下，也有 252 個，因此徹底檢查它們是不可能的。在實(shí)踐中，您可能最終只會考慮幾個場景，并希望您沒有遺漏一些重要的東西。換句話說，公平的死鎖分析無法通過幼稚的方法完成，我們需要一種專門的、更有效的方法。

此方法包括構(gòu)建鎖定圖并檢查它是否存在循環(huán)依賴關(guān)系。鎖定圖是顯示鎖和線程在這些鎖上的交互的圖形。此類圖中的每個閉環(huán)都表示可能存在死鎖，并且沒有閉環(huán)保證了代碼的死鎖安全性。

這是繪制鎖定圖的秘訣。它以第 1 節(jié)中的代碼為例：

對于代碼中的每個鎖，在圖表上放置一個相應(yīng)的節(jié)點(diǎn)；在這個例子中，這些是?lock1?和?lock2?
對于所有線程試圖在已經(jīng)持有鎖 A 的情況下獲取鎖 B 的語句，畫一個從節(jié)點(diǎn) A 到節(jié)點(diǎn) B 的箭頭；在該示例中，將有“鎖1 - >鎖2”在?increment()?和?lock2 -> lock1?中?decrement()?。如果一個線程按順序使用多個鎖，則為每兩個連續(xù)的鎖繪制一個箭頭。

第 1 節(jié)中示例的最終圖表如下所示：

ld2

圖 3

它有一個閉環(huán)： ? lock1 -> lock2 -> lock1?，它立即告訴我們代碼包含潛在的死鎖。

讓我們再做一個練習(xí)。思考以下代碼：

java：

void transaction1 (int amount){
synchronized(lock1) {
synchronized(lock2) {
// do something}
}
void transaction2(int amount){
synchronized(lock2) {
synchronized(lock3) {
// do something}
}
void transaction3(int amount){
synchronized(lock3) {
synchronized(lock1) {
// do zomething}
}

讓我們看看這段代碼是否是死鎖安全的。有3把鎖：?lock1，lock2，lock3?和3條鎖定路徑：?lock1 -> lock2?在?transaction1()?，?lock2 -> lock3?在?transaction2()?，?lock3 -> lock1?在?transaction3()?。

結(jié)果圖如圖 4-A 所示：

圖 4

同樣，此圖立即表明我們的設(shè)計(jì)包含潛在的死鎖。但是，不僅如此。它還提示我們?nèi)绾涡迯?fù)設(shè)計(jì)；我們只需要打破循環(huán)！例如，我們可以交換方法中的鎖?transaction3()?。相應(yīng)的箭頭改變方向，圖 4-B 中的圖變?yōu)闊o循環(huán)，這保證了固定代碼的死鎖安全性。

現(xiàn)在我們已經(jīng)熟悉了圖表的神奇之處，我們準(zhǔn)備繼續(xù)使用更復(fù)雜但更有效的方法來設(shè)計(jì)無死鎖同步。

4. 帶鎖排序的細(xì)粒度同步

這一次，我們走的是讓同步盡可能細(xì)粒度的路線，希望得到最大可能的事務(wù)并發(fā)度作為回報。這種設(shè)計(jì)基于兩個原則。

第一個原則是禁止任何變量同時參與多個交易。為了實(shí)現(xiàn)這一點(diǎn)，我們將每個變量與一個唯一的鎖相關(guān)聯(lián)，并通過獲取與相關(guān)變量關(guān)聯(lián)的所有鎖來啟動每個事務(wù)。以下代碼說明了這一點(diǎn)：

java：

void transaction(Item i1，Item i2, Item i3,double amount){
synchronized(i1.lock) {
synchronized(i2.lock){
synchronized(i3.lock) {
// do actual transaction on the items
}
}
}
}

一旦獲得鎖，其他事務(wù)就不能訪問這些變量，因此它們不會被并發(fā)修改。這意味著系統(tǒng)中的所有事務(wù)都是一致的。同時，允許在不相交變量集上的事務(wù)并發(fā)運(yùn)行。因此，我們獲得了一個高度并發(fā)但線程安全的系統(tǒng)。

但是，這樣的設(shè)計(jì)會立即導(dǎo)致死鎖的可能性，因?yàn)楝F(xiàn)在我們處理多個線程和每個線程的多個鎖。

然后，第二個設(shè)計(jì)原則開始發(fā)揮作用，它指出必須以規(guī)范的順序獲取鎖以防止死鎖。這意味著我們將每個鎖與一個唯一的常量索引相關(guān)聯(lián)，并始終按照它們的索引定義的順序獲取鎖。將這個原理應(yīng)用到上面的代碼中，我們得到了細(xì)粒度設(shè)計(jì)的完整說明：

java：

void transaction(Item i1，Item i2，Item i3，double… amounts) {
// Our plan is to use item IDs as canonical indices for locks
Item[] order = {i1, i2, i3} ;
Arrays.sort(order，(a, b) -> Long. compare(a.id,b.id)) ;
synchronized(order [o].lock){
synchronized(order[1].lock){
synchronized(order[2].lock) {
// do actual transaction on the items
}
}
}
}

但是，確定規(guī)范排序確實(shí)可以防止死鎖嗎？我們能證明嗎？答案是肯定的，我們可以使用鎖定圖來完成。

假設(shè)我們有一個有 N 個變量的系統(tǒng)，所以有 N 個關(guān)聯(lián)的鎖，因此圖中有 N 個節(jié)點(diǎn)。如果沒有強(qiáng)制排序，鎖會以隨機(jī)順序被抓取，所以在圖中，會有兩個方向的隨機(jī)箭頭，并且肯定會存在表示死鎖的閉環(huán)：

圖 5

如果我們強(qiáng)制執(zhí)行鎖排序，從高到低索引的鎖路徑將被排除，所以唯一剩下的箭頭將是那些從左到右的箭頭：

圖 6

無論我們多么努力，我們都不會在這個圖上找到一個閉環(huán)，因?yàn)橹挥挟?dāng)箭頭在兩個方向上時才可能存在閉環(huán)，但事實(shí)并非如此。而且，沒有閉環(huán)意味著沒有死鎖。證明是完整的。

好吧，通過使用細(xì)粒度鎖和鎖排序，我們可以構(gòu)建一個高并發(fā)、線程安全和無死鎖的系統(tǒng)。但是，提高并發(fā)性是否需要付出代價？讓我們考慮一下。

首先，在低并發(fā)的情況下，與粗粒度的方法相比，存在一定的速度損失。每個鎖捕獲是一個相當(dāng)昂貴的操作，但細(xì)粒度設(shè)計(jì)假設(shè)鎖捕獲至少是兩倍。但是，隨著并發(fā)請求數(shù)量的增加，由于使用了多個 CPU 內(nèi)核，細(xì)粒度設(shè)計(jì)很快就會變得更好。

其次，由于大量的鎖對象，存在內(nèi)存開銷。幸運(yùn)的是，這很容易解決。如果受保護(hù)的變量是對象，我們可以擺脫單獨(dú)的鎖對象，并將變量本身用作自己的鎖。否則，例如，如果變量是原始數(shù)組元素，我們可能只需要有限數(shù)量的額外對象。為此，我們定義了從變量 ID 到中等大小的鎖數(shù)組的映射。在這種情況下，鎖必須按它們的實(shí)際索引排序，而不是按變量 ID。

最后但并非最不重要的是代碼的復(fù)雜性。雖然粗粒度的設(shè)計(jì)可以通過聲明一些方法同步來完成，細(xì)粒度的方法需要編寫相當(dāng)數(shù)量的相當(dāng)長的代碼，有時我們甚至可能需要弄亂業(yè)務(wù)邏輯。這樣的代碼需要仔細(xì)編寫并且更難維護(hù)。不幸的是，這個困難無法解決，但結(jié)果值得麻煩，這將在下面演示。

5. 演示項(xiàng)目

要了解提議的設(shè)計(jì)模式在實(shí)際代碼中的外觀，讓我們看一下簡單的演示項(xiàng)目。該項(xiàng)目的目標(biāo)是構(gòu)建一個模擬銀行一些基本功能的庫。為簡潔起見，它使用一組固定的賬戶，僅實(shí)現(xiàn)四種操作：查詢余額、存款、取款和賬戶間資金轉(zhuǎn)移。為了使任務(wù)更有趣，要求賬戶余額不能為負(fù)，也不能超過某個值。違反這些規(guī)則的交易應(yīng)該被拒絕。庫 API 在接口MockBank 中定義。

此接口有三種使用上述不同同步方法的實(shí)現(xiàn)：

CoarseGrainedImpl使用粗粒度同步。
FineGrainedImpl使用細(xì)粒度同步的基本版本。
FineGrainedWithMappingImpl使用細(xì)粒度同步的內(nèi)存高效版本。

還有一個對實(shí)現(xiàn)的性能和正確性的測試，MockBankCrashTest。每個源文件在類注釋中包含算法的詳細(xì)描述。多次測試運(yùn)行未顯示線程安全違規(guī)或死鎖。在多核系統(tǒng)上，細(xì)粒度設(shè)計(jì)的性能是粗粒度設(shè)計(jì)的幾倍，正如預(yù)期的那樣。

所有項(xiàng)目文件都在這里。

6. 隱形鎖

到目前為止，所提出的設(shè)計(jì)模式似乎可以自動解決任何同步問題。雖然這并非完全不真實(shí)，但存在一些您應(yīng)該注意的問題。

上述部分中的注意事項(xiàng)雖然本身是正確和有效的，但并未考慮環(huán)境。通常，這是一個錯誤，因?yàn)槲覀兊拇a不可避免地要與操作系統(tǒng)和庫進(jìn)行交互，其中可能存在隱藏的鎖，這些鎖可能會干擾我們的同步代碼，從而導(dǎo)致意外死鎖。讓我們看一個例子?？紤]以下代碼：

java:

private Hashtable<String，Long> db = new Hashtable<>();
private long version;
public void put (String key,long value) {
updateversion (key);
db. put (key,value) ;
}
public long increment (String key){
db.computeIfPresent (key,(k, v)->{
updateversion(k);
return v+1 ;
}):
}
private synchronized void updateversion (String key){
db.put (key+".version", versiontl++);
}

這么一看，這段代碼應(yīng)該是無死鎖的，因?yàn)?updateVersion()?. 但是，這種印象是錯誤的，因?yàn)镠ashtable實(shí)例中實(shí)際上存在一個額外的隱藏鎖。調(diào)用鏈?put()-updateVersion()?并?increment()-computeIfPresent()-updateVersion()?以相反的順序獲取這兩個鎖，這會導(dǎo)致潛在的死鎖。

一位有經(jīng)驗(yàn)的讀者可能會在這里正確地爭辯說，上面的代碼相當(dāng)蹩腳，并且是故意設(shè)計(jì)來導(dǎo)致死鎖的。然后，這里是更簡潔的示例，我們嘗試在映射中原子地交換兩個值：

java:

private final Map<Integer，String> map = new ConcurrentHashMap<>();
map.put (1，"1");
map. put (2,“2");}
public void swapalues(Integer key1，Integer key2) {
map.compute(key1，(k1，v1) ->{
return map. put (key2, v1); 
// returns v2
}):
}

這一次，根本沒有鎖，代碼看起來完全合法，但是，我們再次遇到了潛在的死鎖。原因是在內(nèi)部設(shè)計(jì)?ConcurrentHashMap?，這已在第 2 節(jié)中概述。以相反的順序調(diào)用?swapValues(1,2)?和?swapValues(2,1)?獲取相應(yīng)桶的鎖，這意味著代碼可能會死鎖。這就是文檔 ?ConcurrentHashMap.compute()?強(qiáng)烈不鼓勵嘗試從回調(diào)中更改地圖的原因。不幸的是，在許多情況下，文檔中缺少此類警告。

如上例所示，對隱藏鎖的干擾最有可能發(fā)生在回調(diào)方法中。因此，建議保持回調(diào)簡短、簡單且不調(diào)用同步方法。如果這是不可能的，您應(yīng)該始終牢記執(zhí)行回調(diào)的線程可能持有一個或多個隱藏鎖，并相應(yīng)地計(jì)劃同步。

結(jié)論

在本文中，我們探討了多線程編程中的死鎖問題。我們發(fā)現(xiàn)如果按照一定的設(shè)計(jì)模式編寫同步代碼，可以完全避免死鎖。我們還研究了此類設(shè)計(jì)為何以及如何工作，其適用性的限制是什么，以及如何有效地發(fā)現(xiàn)和修復(fù)現(xiàn)有代碼中的潛在死鎖。預(yù)計(jì)所提供的材料為設(shè)計(jì)完美的無死鎖同步提供了足夠的實(shí)用指南。

所有源文件都可以作為zip 存檔從 Github 下載。

Java 編程基礎(chǔ)

0 人點(diǎn)贊

在Java中的無死鎖同步實(shí)現(xiàn)方法分享！內(nèi)容解析！干貨分享！

一、死鎖機(jī)制

2. 粗粒度同步

3. 鎖定圖

4. 帶鎖排序的細(xì)粒度同步

5. 演示項(xiàng)目

6. 隱形鎖

結(jié)論

在Java中的無死鎖同步實(shí)現(xiàn)方法分享！內(nèi)容解析！干貨分享！