lua获取utf8(包含中文字)字符串长度

时间:2023-01-30 07:46:30

原文地址http://www.freecls.com/a/2712/e


lua自带的string库计算字符串长度是以字节来算的,所以一个中文字一般会占用1-4个字节

string.len('测试abc')返回的不是5而是大于5,如果想要实现中文字占1个长度,则要引入lua-utf8库

本人用的是centos7,可以直接敲如下命令就行

luarocks install luautf8
lua获取utf8(包含中文字)字符串长度

从控制台可以看出,就是利用lua库把lutf8lib.c编译成动态库lua-utf8.so放在/usr/lib64/lua/5.1目录

当然也可以手动编译,源码下载地址https://github.com/starwing/luautf8

unzip luautf8-master.zip
cd luautf8-master
#编译
gcc -O2 -fPIC -I/usr/include -c lutf8lib.c -o lutf8lib.o

#链接成动态库
gcc -shared -o lua-utf8.so -L/usr/lib64/lua/5.1 lutf8lib.o

然后把lua-utf8.so拷贝到lua默认package.cpath指定的路径,64位centos7拷贝到/usr/lib64/lua/5.1即可

使用例子

local utf8 = require 'lua-utf8'
local str_len = utf8.len('测试abc')
print(str_len)      --5

该库的方法跟标准的string库用法一样,具体用法可以参考lua官网
utf8.byte
utf8.char
utf8.find
utf8.gmatch
utf8.gsub
utf8.len
utf8.lower
utf8.match
utf8.reverse
utf8.sub
utf8.upper

总结

1.lua的版本为5.1,运行环境centos7 64位
2.原文地址http://www.freecls.com/a/2712/e