Lua 的解析器有官方的 standard Lua 和 LuaJIT,需要明確一點的是目前大量的優(yōu)化文章都比較陳舊,而且都是針對 standard Lua 解析器的,standard Lua 解析器在性能上需要書寫者自己規(guī)避,才能寫出高性能來。需要各位看官注意的是,OpenResty 最新版默認(rèn)已經(jīng)綁定 LuaJIT,優(yōu)化手段和方法已經(jīng)略有不同。我們現(xiàn)在的做法是:代碼易讀是首位,目前還沒有碰到同樣代碼換個寫法就有質(zhì)的提升,如果我們對某個單點功能有性能要求,那么建議用 LuaJIT 的 FFI 方法直接調(diào)用 C 接口更直接一點。
代碼出處:http://www.cnblogs.com/lovevivi/p/3284643.html
3.0 避免使用table.insert()
下面來看看4個實現(xiàn)表插入的方法。在4個方法之中table.insert()在效率上不如其他方法,是應(yīng)該避免使用的。
使用table.insert
local a = {}
local table_insert = table.insert
for i = 1,100 do
table_insert( a, i )
end
使用循環(huán)的計數(shù)
local a = {}
for i = 1,100 do
a[i] = i
end
使用table的size
local a = {}
for i = 1,100 do
a[#a+1] = i
end
使用計數(shù)器
local a = {}
local index = 1
for i = 1,100 do
a[index] = i
index = index+1
end
4.0 減少使用 unpack()函數(shù)
Lua的unpack()函數(shù)不是一個效率很高的函數(shù)。你完全可以寫一個循環(huán)來代替它的作用。
使用unpack()
local a = { 100, 200, 300, 400 }
for i = 1,100 do
print( unpack(a) )
end
代替方法
local a = { 100, 200, 300, 400 }
for i = 1,100 do
print( a[1],a[2],a[3],a[4] )
end
針對這篇文章內(nèi)容寫了一些測試代碼:
local start = os.clock()
local function sum( ... )
local args = {...}
local a = 0
for k,v in pairs(args) do
a = a + v
end
return a
end
local function test_unit( )
-- t1: 0.340182 s
-- local a = {}
-- for i = 1,1000 do
-- table.insert( a, i )
-- end
-- t2: 0.332668 s
-- local a = {}
-- for i = 1,1000 do
-- a[#a+1] = i
-- end
-- t3: 0.054166 s
-- local a = {}
-- local index = 1
-- for i = 1,1000 do
-- a[index] = i
-- index = index+1
-- end
-- p1: 0.708012 s
-- local a = 0
-- for i=1,1000 do
-- local t = { 1, 2, 3, 4 }
-- for i,v in ipairs( t ) do
-- a = a + v
-- end
-- end
-- p2: 0.660426 s
-- local a = 0
-- for i=1,1000 do
-- local t = { 1, 2, 3, 4 }
-- for i = 1,#t do
-- a = a + t[i]
-- end
-- end
-- u1: 2.121722 s
-- local a = { 100, 200, 300, 400 }
-- local b = 1
-- for i = 1,1000 do
-- b = sum(unpack(a))
-- end
-- u2: 1.701365 s
-- local a = { 100, 200, 300, 400 }
-- local b = 1
-- for i = 1,1000 do
-- b = sum(a[1], a[2], a[3], a[4])
-- end
return b
end
for i=1,10 do
for j=1,1000 do
test_unit()
end
end
print(os.clock()-start)
從運行結(jié)果來看,除了 t3 有本質(zhì)上的性能提升(六倍性能差距,但是 t3 寫法相當(dāng)丑陋),其他不同的寫法都在一個數(shù)量級上。你是愿意讓代碼更易懂還是更牛逼,就看各位看官自己的抉擇了。不要盲信,也不要不信,各位要睜開眼自己多做測試。
另外說明:文章提及的使用局部變量、緩存 table 元素,在 LuaJIT 中還是很有用的。
todo:優(yōu)化測試用例,讓他更直觀,自己先備注一下。