自己写一个软件渲染器的时候,无意中发现float转换int非常耗时,于是查阅文章,这才有了这个命题,以前不清楚还有这么个机制。网上看了很多文章,搜索到了一个数字6755399441055744,这个是double快速转换int的一个magic number。至于原理我一知半解,主要看效果。经测试,这个函数的效率比c++直接float转int高很多,记录下来以便备忘。
//
// 将64位浮点数转换为32位整数
// 小数部分将四舍五入到偶数
//
//用于double的magic number是1.5*2^52=6755399441055744.0
//对于double来说,相应的magic number就是1.5*2^36
//处理float的速度比汇编低1/3
//编译器优化情况下,比手写汇编快 inline int32_t f_toint(double x)
{
x += 6755399441055744.0;
return *(int32_t*)&x;
} //四舍五入,处理的数据范围是-2^22 ~ 2^22-1, -4194304.0 ~ 4194303.0
inline int32_t f_toint32(float x)
{
//取得符号位,设置掩码
uint32_t n = ((*(uint32_t*)&x) & 0x80000000) ? 0xFFC00000 : 0;
x += 12582912.0f;
return ((*(uint32_t*)&x) & 0x3FFFFF) | n;
}
f_toint32的原型是csdn论坛一个网友说的回复:
inline
long
magic_f2l(
float
x )
{
static
long
mask[] = { 0x0, 0xffc00000 };
static
float
trunc[] = { -.5f, .5f };
int
s = ( *(unsigned
long
*)&x )>>31;
x += trunc[s];
x += 12582912.f;
return
(*(
long
*)&x) & 0x3fffff | mask[s];
}
这个里面用到了12582912这个魔法数字,和double转换那个是一样的,都可以用这个函数得到:
double float_magic_number(int bits)
{
return 1.5 * STD::pow(2.0, double(bits));
}
但magic_f2l()这个函数效率并没有double版本的那么好,原因估计是运算运算太多了,于是我精简了一下:
inline
long
magic_f2l(
float
x )
{
static
long
mask[] = { 0x0, 0xffc00000 };
static
float
trunc[] = { -.5f, .5f };
int
s = ( *(unsigned
long
*)&x )>>31;//这里得到float的符号位,如果是负数,最后结果就和0xFFC00000进行or运算。这里有个位移操作
x += trunc[s];//这里有个加法和数组取值操作
x += 12582912.f;
return
(*(
long
*)&x) & 0x3fffff | mask[s];//数组取值
}
经简化,完成如下函数,这个效率和double版本不相上下,稍微慢一丢丢(几个时钟周期),仍然把c++默认转换摔在后面。
inline int32_t f_toint32(float x)
{
//取得符号位,设置掩码
uint32_t n = ((*(uint32_t*)&x) & 0x80000000) ? 0xFFC00000 : 0;//一个三元操作符,直接储存掩码
x += 12582912.0f;//魔法数字加法
return ((*(uint32_t*)&x) & 0x3FFFFF) | n;//直接or运算
}