FFI 庫(kù),是 LuaJIT 中最重要的一個(gè)擴(kuò)展庫(kù)。它允許從純 Lua 代碼調(diào)用外部 C 函數(shù),使用 C 數(shù)據(jù)結(jié)構(gòu)。有了它,就不用再像 Lua 標(biāo)準(zhǔn) ?math
?庫(kù)一樣,編寫(xiě) Lua 擴(kuò)展庫(kù)。把開(kāi)發(fā)者從開(kāi)發(fā) Lua 擴(kuò)展 C 庫(kù)(語(yǔ)言/功能綁定庫(kù))的繁重工作中釋放出來(lái)。學(xué)習(xí)完本小節(jié)對(duì)開(kāi)發(fā)純 ?ffi
?的庫(kù)是有幫助的,像 lru-resty-lrucache 中的 ?pureffi.lua
?,這個(gè)純 ?ffi
? 庫(kù)非常高效地完成了 ?lru
?緩存策略。
簡(jiǎn)單解釋一下 Lua 擴(kuò)展 C 庫(kù),對(duì)于那些能夠被 Lua 調(diào)用的 C 函數(shù)來(lái)說(shuō),它的接口必須遵循 Lua 要求的形式,就是 ?typedef int (*lua_CFunction)(lua_State* L)
?,這個(gè)函數(shù)包含的參數(shù)是 ?lua_State
?類(lèi)型的指針 L 。可以通過(guò)這個(gè)指針進(jìn)一步獲取通過(guò) Lua 代碼傳入的參數(shù)。這個(gè)函數(shù)的返回值類(lèi)型是一個(gè)整型,表示返回值的數(shù)量。需要注意的是,用 C 編寫(xiě)的函數(shù)無(wú)法把返回值返回給 Lua 代碼,而是通過(guò)虛擬棧來(lái)傳遞 Lua 和 C 之間的調(diào)用參數(shù)和返回值。不僅在編程上開(kāi)發(fā)效率變低,而且性能上比不上 FFI 庫(kù)調(diào)用 C 函數(shù)。
FFI 庫(kù)最大限度的省去了使用 C 手工編寫(xiě)繁重的 ?Lua/C
? 綁定的需要。不需要學(xué)習(xí)一門(mén)獨(dú)立/額外的綁定語(yǔ)言——它解析普通 C 聲明。這樣可以從 C 頭文件或參考手冊(cè)中,直接剪切,粘貼。它的任務(wù)就是綁定很大的庫(kù),但不需要搗鼓脆弱的綁定生成器。
FFI 緊緊的整合進(jìn)了 LuaJIT(幾乎不可能作為一個(gè)獨(dú)立的模塊)。?JIT
?編譯器在 C 數(shù)據(jù)結(jié)構(gòu)上所產(chǎn)生的代碼,等同于一個(gè) C 編譯器應(yīng)該生產(chǎn)的代碼。在 ?JIT
?編譯過(guò)的代碼中,調(diào)用 C 函數(shù),可以被內(nèi)連處理,不同于基于 ?Lua/C API
? 函數(shù)調(diào)用。
noun | Explanation |
---|---|
cdecl | A definition of an abstract C type(actually, is a lua string) |
ctype | C type object |
cdata | C data object |
ct | C type format, is a template object, may be cdecl, cdata, ctype |
cb | callback object |
VLA | An array of variable length |
VLS | A structure of variable length |
功能: Lua ffi 庫(kù)的 API,與 LuaJIT 不可分割。
毫無(wú)疑問(wèn),在 ?lua
?文件中使用 ?ffi
?庫(kù)的時(shí)候,必須要有下面的一行。
local ffi = require "ffi"
語(yǔ)法: ffi.cdef(def)
功能: 聲明 C 函數(shù)或者 C 的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)結(jié)構(gòu)可以是結(jié)構(gòu)體、枚舉或者是聯(lián)合體,函數(shù)可以是 C 標(biāo)準(zhǔn)函數(shù),或者第三方庫(kù)函數(shù),也可以是自定義的函數(shù),注意這里只是函數(shù)的聲明,并不是函數(shù)的定義。聲明的函數(shù)應(yīng)該要和原來(lái)的函數(shù)保持一致。
ffi.cdef[[
typedef struct foo { int a, b; } foo_t; /* Declare a struct and typedef. */
int printf(const char *fmt, ...); /* Declare a typical printf function. */
]]
注意: 所有使用的庫(kù)函數(shù)都要對(duì)其進(jìn)行聲明,這和我們寫(xiě) C 語(yǔ)言時(shí)候引入 .h 頭文件是一樣的。
順帶一提的是,并不是所有的 C 標(biāo)準(zhǔn)函數(shù)都能滿足我們的需求,那么如何使用 第三方庫(kù)函數(shù) 或 自定義的函數(shù) 呢,這會(huì)稍微麻煩一點(diǎn),不用擔(dān)心,你可以很快學(xué)會(huì)。: ) 首先創(chuàng)建一個(gè) ?myffi.c
?,其內(nèi)容是:
int add(int x, int y)
{
return x + y;
}
接下來(lái)在 Linux 下生成動(dòng)態(tài)鏈接庫(kù):
gcc -g -o libmyffi.so -fpic -shared myffi.c
為了方便我們測(cè)試,我們?cè)?nbsp;?LD_LIBRARY_PATH
?這個(gè)環(huán)境變量中加入了剛剛庫(kù)所在的路徑,因?yàn)榫幾g器在查找動(dòng)態(tài)庫(kù)所在的路徑的時(shí)候其中一個(gè)環(huán)節(jié)就是在 ?LD_LIBRARY_PATH
?這個(gè)環(huán)境變量中的所有路徑進(jìn)行查找。命令如下所示。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:your_lib_path
在 Lua 代碼中要增加如下的行:
ffi.load(name [,global])
?ffi.load
? 會(huì)通過(guò)給定的 ?name
?加載動(dòng)態(tài)庫(kù),返回一個(gè)綁定到這個(gè)庫(kù)符號(hào)的新的 C 庫(kù)命名空間,在 POSIX 系統(tǒng)中,如果 ?global
?被設(shè)置為 ?ture
?,這個(gè)庫(kù)符號(hào)被加載到一個(gè)全局命名空間。另外這個(gè) ?name
?可以是一個(gè)動(dòng)態(tài)庫(kù)的路徑,那么會(huì)根據(jù)路徑來(lái)查找,否則的話會(huì)在默認(rèn)的搜索路徑中去找動(dòng)態(tài)庫(kù)。在 POSIX 系統(tǒng)中,如果在 ?name 這個(gè)字段中沒(méi)有寫(xiě)上點(diǎn)符號(hào) .,那么 ?.so
? 將會(huì)被自動(dòng)添加進(jìn)去,例如 ?ffi.load("z")
?會(huì)在默認(rèn)的共享庫(kù)搜尋路徑中去查找 ?libz.so
?,在 ?windows
?系統(tǒng),如果沒(méi)有包含點(diǎn)號(hào),那么 ?.dll
? 會(huì)被自動(dòng)加上。
下面看一個(gè)完整例子:
local ffi = require "ffi"
local myffi = ffi.load('myffi')
ffi.cdef[[
int add(int x, int y); /* don't forget to declare */
]]
local res = myffi.add(1, 2)
print(res) -- output: 3 Note: please use luajit to run this script.
除此之外,還能使用 ?ffi.C
? (調(diào)用 ffi.cdef 中聲明的系統(tǒng)函數(shù)) 來(lái)直接調(diào)用 ?add
?函數(shù),記得要在 ?ffi.load
? 的時(shí)候加上參數(shù) ?true
?,例如 ?ffi.load('myffi', true)
?。
完整的代碼如下所示:
local ffi = require "ffi"
ffi.load('myffi',true)
ffi.cdef[[
int add(int x, int y); /* don't forget to declare */
]]
local res = ffi.C.add(1, 2)
print(res) -- output: 3 Note: please use luajit to run this script.
語(yǔ)法: ctype = ffi.typeof(ct)
功能: 創(chuàng)建一個(gè) ctype 對(duì)象,會(huì)解析一個(gè)抽象的 C 類(lèi)型定義。
local uintptr_t = ffi.typeof("uintptr_t")
local c_str_t = ffi.typeof("const char*")
local int_t = ffi.typeof("int")
local int_array_t = ffi.typeof("int[?]")
語(yǔ)法: cdata = ffi.new(ct [,nelem] [,init...])
功能: 開(kāi)辟空間,第一個(gè)參數(shù)為 ctype 對(duì)象,ctype 對(duì)象最好通過(guò) ctype = ffi.typeof(ct) 構(gòu)建。
順便一提,可能很多人會(huì)有疑問(wèn),到底 ?ffi.new
? 和 ?ffi.C.malloc
? 有什么區(qū)別呢?
如果使用 ?ffi.new
? 分配的 ?cdata
?對(duì)象指向的內(nèi)存塊是由垃圾回收器 ?LuaJIT GC
? 自動(dòng)管理的,所以不需要用戶(hù)去釋放內(nèi)存。
如果使用 ?ffi.C.malloc
? 分配的空間便不再使用 LuaJIT 自己的分配器了,所以不是由 ?LuaJIT GC
? 來(lái)管理的,但是,要注意的是 ?ffi.C.malloc
? 返回的指針本身所對(duì)應(yīng)的 ?cdata
?對(duì)象還是由 ?LuaJIT GC
? 來(lái)管理的,也就是這個(gè)指針的 ?cdata
?對(duì)象指向的是用 ?ffi.C.malloc
? 分配的內(nèi)存空間。這個(gè)時(shí)候,你應(yīng)該通過(guò) ?ffi.gc()
? 函數(shù)在這個(gè) C 指針的 ?cdata
?對(duì)象上面注冊(cè)自己的析構(gòu)函數(shù),這個(gè)析構(gòu)函數(shù)里面你可以再調(diào)用 ?ffi.C.free
?,這樣的話當(dāng) C 指針?biāo)鶎?duì)應(yīng)的 ?cdata
?對(duì)象被 ?Luajit GC
? 管理器垃圾回收時(shí)候,也會(huì)自動(dòng)調(diào)用你注冊(cè)的那個(gè)析構(gòu)函數(shù)來(lái)執(zhí)行 C 級(jí)別的內(nèi)存釋放。
請(qǐng)盡可能使用最新版本的 ?Luajit
?,?x86_64
?上由 ?LuaJIT GC
? 管理的內(nèi)存已經(jīng)由 ?1G->2G
?,雖然管理的內(nèi)存變大了,但是如果要使用很大的內(nèi)存,還是用 ?ffi.C.malloc
? 來(lái)分配會(huì)比較好,避免耗盡了 ?LuaJIT GC
? 管理內(nèi)存的上限,不過(guò)還是建議不要一下子分配很大的內(nèi)存。
local int_array_t = ffi.typeof("int[?]")
local bucket_v = ffi.new(int_array_t, bucket_sz)
local queue_arr_type = ffi.typeof("lrucache_pureffi_queue_t[?]")
local q = ffi.new(queue_arr_type, size + 1)
語(yǔ)法: ffi.fill(dst, len [,c])
功能: 填充數(shù)據(jù),此函數(shù)和 memset(dst, c, len) 類(lèi)似,注意參數(shù)的順序。
ffi.fill(self.bucket_v, ffi_sizeof(int_t, bucket_sz), 0)
ffi.fill(q, ffi_sizeof(queue_type, size + 1), 0)
語(yǔ)法: cdata = ffi.cast(ct, init)
功能: 創(chuàng)建一個(gè) scalar cdata 對(duì)象。
local c_str_t = ffi.typeof("const char*")
local c_str = ffi.cast(c_str_t, str) -- 轉(zhuǎn)換為指針地址
local uintptr_t = ffi.typeof("uintptr_t")
tonumber(ffi.cast(uintptr_t, c_str)) -- 轉(zhuǎn)換為數(shù)字
所有由顯式的 ?ffi.new()
?, ?ffi.cast()
?etc. 或者隱式的 ?accessors
?所創(chuàng)建的 ?cdata
?對(duì)象都是能被垃圾回收的,當(dāng)他們被使用的時(shí)候,你需要確保有在 ?Lua stack,upvalue
?,或者 ?Lua table
? 上保留有對(duì) ?cdata
?對(duì)象的有效引用,一旦最后一個(gè) ?cdata
?對(duì)象的有效引用失效了,那么垃圾回收器將自動(dòng)釋放內(nèi)存(在下一個(gè) ?GC
?周期結(jié)束時(shí)候)。另外如果你要分配一個(gè) ?cdata
?數(shù)組給一個(gè)指針的話,你必須保持這個(gè)持有這個(gè)數(shù)據(jù)的 ?cdata
?對(duì)象活躍,下面給出一個(gè)官方的示例:
ffi.cdef[[
typedef struct { int *a; } foo_t;
]]
local s = ffi.new("foo_t", ffi.new("int[10]")) -- WRONG!
local a = ffi.new("int[10]") -- OK
local s = ffi.new("foo_t", a)
-- Now do something with 's', but keep 'a' alive until you're done.
相信看完上面的 ?API
?你已經(jīng)很累了,再堅(jiān)持一下吧!休息幾分鐘后,讓我們來(lái)看看下面對(duì)官方文檔中的示例做剖析,希望能再加深你對(duì) ?ffi
?的理解。
真的很用容易去調(diào)用一個(gè)外部 C 庫(kù)函數(shù),示例代碼:
local ffi = require("ffi")
ffi.cdef[[
int printf(const char *fmt, ...);
]]
ffi.C.printf("Hello %s!", "world")
以上操作步驟,如下:
事實(shí)上,背后的實(shí)現(xiàn)遠(yuǎn)非如此簡(jiǎn)單:③ 使用標(biāo)準(zhǔn) C 庫(kù)的命名空間 ?ffi.C
?。通過(guò)符號(hào)名 ?printf
?索引這個(gè)命名空間,自動(dòng)綁定標(biāo)準(zhǔn) C 庫(kù)。索引結(jié)果是一個(gè)特殊類(lèi)型的對(duì)象,當(dāng)被調(diào)用時(shí),執(zhí)行 ?printf
?函數(shù)。傳遞給這個(gè)函數(shù)的參數(shù),從 Lua 對(duì)象自動(dòng)轉(zhuǎn)換為相應(yīng)的 C 類(lèi)型。
再來(lái)一個(gè)源自官方的示例代碼:
local ffi = require("ffi")
ffi.cdef[[
unsigned long compressBound(unsigned long sourceLen);
int compress2(uint8_t *dest, unsigned long *destLen,
const uint8_t *source, unsigned long sourceLen, int level);
int uncompress(uint8_t *dest, unsigned long *destLen,
const uint8_t *source, unsigned long sourceLen);
]]
local zlib = ffi.load(ffi.os == "Windows" and "zlib1" or "z")
local function compress(txt)
local n = zlib.compressBound(#txt)
local buf = ffi.new("uint8_t[?]", n)
local buflen = ffi.new("unsigned long[1]", n)
local res = zlib.compress2(buf, buflen, txt, #txt, 9)
assert(res == 0)
return ffi.string(buf, buflen[0])
end
local function uncompress(comp, n)
local buf = ffi.new("uint8_t[?]", n)
local buflen = ffi.new("unsigned long[1]", n)
local res = zlib.uncompress(buf, buflen, comp, #comp)
assert(res == 0)
return ffi.string(buf, buflen[0])
end
-- Simple test code.
local txt = string.rep("abcd", 1000)
print("Uncompressed size: ", #txt)
local c = compress(txt)
print("Compressed size: ", #c)
local txt2 = uncompress(c, #txt)
assert(txt2 == txt)
解釋一下這段代碼。我們首先使用 ?ffi.cdef
? 聲明了一些被 zlib 庫(kù)提供的 C 函數(shù)。然后加載 zlib 共享庫(kù),在 Windows 系統(tǒng)上,則需要我們手動(dòng)從網(wǎng)上下載 zlib1.dll 文件,而在 POSIX 系統(tǒng)上 libz 庫(kù)一般都會(huì)被預(yù)安裝。因?yàn)?nbsp;ffi.load 函數(shù)會(huì)自動(dòng)填補(bǔ)前綴和后綴,所以我們簡(jiǎn)單地使用 z 這個(gè)字母就可以加載了。我們檢查 ?ffi.os
?,以確保我們傳遞給 ?ffi.load
? 函數(shù)正確的名字。
一開(kāi)始,壓縮緩沖區(qū)的最大值被傳遞給 ?compressBound
?函數(shù),下一行代碼分配了一個(gè)要壓縮字符串長(zhǎng)度的字節(jié)緩沖區(qū)。?[?]
? 意味著他是一個(gè)變長(zhǎng)數(shù)組。它的實(shí)際長(zhǎng)度由 ?ffi.new
? 函數(shù)的第二個(gè)參數(shù)指定。
我們仔細(xì)審視一下 ?compress2
?函數(shù)的聲明就會(huì)發(fā)現(xiàn),目標(biāo)長(zhǎng)度是用指針傳遞的!這是因?yàn)槲覀円獋鬟f進(jìn)去緩沖區(qū)的最大值,并且得到緩沖區(qū)實(shí)際被使用的大小。
在 C 語(yǔ)言中,我們可以傳遞變量地址。但因?yàn)樵?Lua 中并沒(méi)有地址相關(guān)的操作符,所以我們使用只有一個(gè)元素的數(shù)組來(lái)代替。我們先用最大緩沖區(qū)大小初始化這唯一一個(gè)元素,接下來(lái)就是很直觀地調(diào)用 ?zlib.compress2
? 函數(shù)了。使用 ?ffi.string
? 函數(shù)得到一個(gè)存儲(chǔ)著壓縮數(shù)據(jù)的 Lua 字符串,這個(gè)函數(shù)需要一個(gè)指向數(shù)據(jù)起始區(qū)的指針和實(shí)際長(zhǎng)度。實(shí)際長(zhǎng)度將會(huì)在 ?buflen
?這個(gè)數(shù)組中返回。因?yàn)閴嚎s數(shù)據(jù)并不包括原始字符串的長(zhǎng)度,所以我們要顯式地傳遞進(jìn)去。
?cdata
?類(lèi)型用來(lái)將任意 C 數(shù)據(jù)保存在 Lua 變量中。這個(gè)類(lèi)型相當(dāng)于一塊原生的內(nèi)存,除了賦值和相同性判斷,Lua 沒(méi)有為之預(yù)定義任何操作。然而,通過(guò)使用 ?metatable
?(元表),程序員可以為 ?cdata
?自定義一組操作。?cdata
?不能在 Lua 中創(chuàng)建出來(lái),也不能在 Lua 中修改。這樣的操作只能通過(guò) C API。這一點(diǎn)保證了宿主程序完全掌管其中的數(shù)據(jù)。
我們將 C 語(yǔ)言類(lèi)型與 ?metamethod
?(元方法)關(guān)聯(lián)起來(lái),這個(gè)操作只用做一次。?ffi.metatype
? 會(huì)返回一個(gè)該類(lèi)型的構(gòu)造函數(shù)。原始 C 類(lèi)型也可以被用來(lái)創(chuàng)建數(shù)組,元方法會(huì)被自動(dòng)地應(yīng)用到每個(gè)元素。
尤其需要指出的是,?metatable
?與 C 類(lèi)型的關(guān)聯(lián)是永久的,而且不允許被修改,?__index
?元方法也是。
下面是一個(gè)使用 C 數(shù)據(jù)結(jié)構(gòu)的實(shí)例
local ffi = require("ffi")
ffi.cdef[[
typedef struct { double x, y; } point_t;
]]
local point
local mt = {
__add = function(a, b) return point(a.x+b.x, a.y+b.y) end,
__len = function(a) return math.sqrt(a.x*a.x + a.y*a.y) end,
__index = {
area = function(a) return a.x*a.x + a.y*a.y end,
},
}
point = ffi.metatype("point_t", mt)
local a = point(3, 4)
print(a.x, a.y) --> 3 4
print(#a) --> 5
print(a:area()) --> 25
local b = a + point(0.5, 8)
print(#b) --> 12.5
附表:Lua 與 C 語(yǔ)言語(yǔ)法對(duì)應(yīng)關(guān)系
Idiom | C code | Lua code |
---|---|---|
Pointer dereference | x = *p | x = p[0] |
int *p | *p = y | p[0] = y |
Pointer indexing | x = p[i] | x = p[i] |
int i, *p | p[i+1] = y | p[i+1] = y |
Array indexing | x = a[i] | x = a[i] |
int i, a[] | a[i+1] = y | a[i+1] = y |
struct/union dereference | x = s.field | x = s.field |
struct foo s | s.field = y | s.field = y |
struct/union pointer deref | x = sp->field | x = sp.field |
struct foo *sp | sp->field = y | s.field = y |
int i, *p | y = p - i | y = p - i |
Pointer dereference | x = p1 - p2 | x = p1 - p2 |
Array element pointer | x = &a[i] | x = a + i |
所謂“能力越大,責(zé)任越大”,F(xiàn)FI 庫(kù)在允許我們調(diào)用 C 函數(shù)的同時(shí),也把內(nèi)存管理的重?fù)?dān)壓到我們的肩上。 還好 FFI 庫(kù)提供了很好用的 ffi.gc 方法。該方法允許給 cdata 對(duì)象注冊(cè)在 GC 時(shí)調(diào)用的回調(diào),它能讓你在 Lua 領(lǐng)域里完成 C 手工釋放資源的事。
C++ 提倡用一種叫 RAII 的方式管理你的資源。簡(jiǎn)單地說(shuō),就是創(chuàng)建對(duì)象時(shí)獲取,銷(xiāo)毀對(duì)象時(shí)釋放。我們可以在 LuaJIT 的 FFI 里借鑒同樣的做法,在調(diào)用 ?resource = ffi.C.xx_create
? 等申請(qǐng)資源的函數(shù)之后,立即補(bǔ)上一行 ?ffi.gc(resource, ...)
? 來(lái)注冊(cè)釋放資源的函數(shù)。盡量避免嘗試手動(dòng)釋放資源!即使不考慮 error 對(duì)執(zhí)行路徑的影響,在每個(gè)出口都補(bǔ)上一模一樣的邏輯會(huì)夠你受的(用 goto 也差不多,只是稍稍好一點(diǎn))。
有些時(shí)候,?ffi.C.xx_create
? 返回的不是具體的 cdata,而是整型的 handle。這會(huì)兒需要用 ?ffi.metatype
? 把 ?ffi.gc
? 包裝一下:
local resource_type = ffi.metatype("struct {int handle;}", {
__gc = free_resource
})
local function free_resource(handle)
...
end
resource = ffi.new(resource_type)
resource.handle = ffi.C.xx_create()
如果你沒(méi)能把申請(qǐng)資源和釋放資源的步驟放一起,那么內(nèi)存泄露多半會(huì)在前方等你。寫(xiě)代碼的時(shí)候切記這一點(diǎn)。
更多建議: