void inner5 (vec_ptr x,vec_ptr y;data_t *dest)
{
long int i;
int length = vec_length(x);
data_t *xdata = get_vec_start(x);
data_t *ydata = get_vec_start(y);
data_t sum = (data_t)0;
long int limit = length-2;
for(i=0;i<limit;i+=3)
{
sum = sum+xdata[i]*ydata[i]+xdata[i+1]*ydata[i+1]+xdata[i+2]*ydata[i+2];
}
for(;i<length ;i++)
{
sum = sum + xdata[i]*ydata[i];
}
*dest = sum;
}
A 受加载性能的影响,因为每次计算需要两个存储器加载。
B 因为影响浮点性能的数据相关没有改变,关键路径还是一个浮点加法。