8.4. 每-CPU 的變量

2018-02-24 15:49 更新

8.4.?每-CPU 的變量

每-CPU 變量是一個有趣的 2.6 內(nèi)核的特性. 當(dāng)你創(chuàng)建一個每-CPU變量, 系統(tǒng)中每個處理器獲得它自己的這個變量拷貝. 這個可能象一個想做的奇怪的事情, 但是它有自己的優(yōu)點. 存取每-CPU變量不需要(幾乎)加鎖, 因為每個處理器使用它自己的拷貝. 每-CPU 變量也可存在于它們各自的處理器緩存中, 這樣對于頻繁更新的量子帶來了顯著的更好性能.

一個每-CPU變量的好的使用例子可在網(wǎng)絡(luò)子系統(tǒng)中找到. 內(nèi)核維護(hù)無結(jié)尾的計數(shù)器來跟蹤有每種報文類型有多少被接收; 這些計數(shù)器可能每秒幾千次地被更新. 不去處理緩存和加鎖問題, 網(wǎng)絡(luò)開發(fā)者將統(tǒng)計計數(shù)器放進(jìn)每-CPU變量. 現(xiàn)在更新是無鎖并且快的. 在很少的機會用戶空間請求看到計數(shù)器的值, 相加每個處理器的版本并且返回總數(shù)是一個簡單的事情.

每-CPU變量的聲明可在 <linux/percpu.h> 中找到. 為在編譯時間創(chuàng)建一個每-CPU變量, 使用這個宏定義:


DEFINE_PER_CPU(type, name);

如果這個變量(稱為 name 的)是一個數(shù)組, 包含這個類型的維數(shù)信息. 因此, 一個有 3 個整數(shù)的每-CPU 數(shù)組應(yīng)當(dāng)被創(chuàng)建使用:


DEFINE_PER_CPU(int[3], my_percpu_array); 

每-CPU變量幾乎不必使用明確的加鎖來操作. 記住 2.6 內(nèi)核是可搶占的; 對于一個處理器, 在修改一個每-CPU變量的臨界區(qū)中不應(yīng)當(dāng)被搶占. 并且如果你的進(jìn)程在對一個每-CPU變量存取時將, 要被移動到另一個處理器上, 也不好. 因為這個原因, 你必須顯式使用 get_cpu_var 宏來存取當(dāng)前處理器的給定變量拷貝, 并且當(dāng)你完成時調(diào)用 put_cpu_var. 對 get_cpu_var 的調(diào)用返回一個 lvalue 給當(dāng)前處理器的變量版本并且禁止搶占. 因為一個 lvalue 被返回, 它可被賦值給或者直接操作. 例如, 一個網(wǎng)絡(luò)代碼中的計數(shù)器時使用這 2 個語句來遞增的:


get_cpu_var(sockets_in_use)++;
put_cpu_var(sockets_in_use);

你可以存取另一個處理器的變量拷貝, 使用:


per_cpu(variable, int cpu_id); 

如果你編寫使處理器涉及到對方的每-CPU變量的代碼, 你, 當(dāng)然, 一定要實現(xiàn)一個加鎖機制來使存取安全.

動態(tài)分配每-CPU變量也是可能的. 這些變量可被分配, 使用:


void *alloc_percpu(type);
void *__alloc_percpu(size_t size, size_t align);

在大部分情況, alloc_percpu 做的不錯; 你可以調(diào)用 __alloc_percpu 在需要一個特別的對齊的情況下. 在任一情況下, 一個 每-CPU 變量可以使用 free_percpu 被返回給系統(tǒng). 存取一個動態(tài)分配的每-CPU變量通過 per_cpu_ptr 來完成:


per_cpu_ptr(void *per_cpu_var, int cpu_id);

這個宏返回一個指針指向 per_cpu_var 對應(yīng)于給定 cpu_id 的版本. 如果你在簡單地讀另一個 CPU 的這個變量的版本, 你可以解引用這個指針并且用它來完成. 如果, 但是, 你在操作當(dāng)前處理器的版本, 你可能需要首先保證你不能被移出那個處理器. 如果你存取這個每-CPU變量的全部都持有一個自旋鎖, 萬事大吉. 常常, 但是, 你需要使用 get_cpu 來阻止在使用變量時的搶占. 因此, 使用動態(tài)每-CPU變量的代碼會看來如此:


int cpu; 
cpu = get_cpu()
ptr = per_cpu_ptr(per_cpu_var, cpu);
/* work with ptr */
put_cpu();

當(dāng)使用編譯時每-CPU 變量時, get_cpu_var 和 put_cpu_var 宏來照看這些細(xì)節(jié). 動態(tài)每-CPU變量需要更多的顯式的保護(hù).

每-CPU變量能夠輸出給每個模塊, 但是你必須使用一個特殊的宏版本:


EXPORT_PER_CPU_SYMBOL(per_cpu_var);
EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);

為在一個模塊內(nèi)存取這樣一個變量, 聲明它, 使用:


DECLARE_PER_CPU(type, name); 

DECLARE_PER_CPU 的使用(不是 DEFINE_PER_CPU)告知編譯器進(jìn)行一個外部引用.

如果你想使用每-CPU變量來創(chuàng)建一個簡單的整數(shù)計數(shù)器, 看一下在 <linux/percpu_counter.h> 中的現(xiàn)成的實現(xiàn). 最后, 注意一些體系有有限數(shù)量的地址空間變量給每-CPU變量. 如果你創(chuàng)建每-CPU變量在你自己的代碼, 你應(yīng)當(dāng)盡量使它們小.

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號