C语言中赋值表达式的返回值是什么?

时间:2023-03-09 16:20:32
C语言中赋值表达式的返回值是什么?

我们或多或少都有过,或者见过将赋值表达式参与运算的情况。这通常会伴随着一些意想不到的问题。今天我就见到了一段奇怪的代码:

#include<stdio.h>
int main()
{
int a =;
int b = (a=)+(a=);
printf("%d %d\n",a,b);
return ;
}

乍一看,似乎答案很明朗,按照顺序运算之后,a的值是3,b的值是5.有经验的程序员肯定会一眼看出,这里的计算过程是一个未定义行为(Undefined behavior).在这里简单来说就是:无法确定哪一个括号里的表达式会先执行。
括号只能改变运算符的结合律,不能改变表达式的求值顺序。这个顺序是取决于编译器的。所以a的值是2还是3是不能确定的。
这段代码在gcc(Ubuntu)下得到的结果是

 

而在clang(Mac)下运行的结果是

 

为什么会这样呢? 这是怎么一回事呢?

查看它们生成的汇编代码

gcc
...
movl $, -(%rbp) // a=
movl $, -(%rbp) // a =
movl $, -(%rbp) //a =
movl -(%rbp), %eax // eax = a
addl %eax, %eax //eax = eax + eax
movl %eax, -(%rbp) // b = eax
... clang
...
movl $, -(%rbp)
movl $, -(%rbp) // a =
movl $, -(%rbp) // a =
movl $, -(%rbp) // b =
...

在gcc的理解中

a = (b=c)
//会被改写成
b=c
a=b
//所以对于
a = (b=c)+(d=e)
//会被改写成
b = c
d = e
a = b+d
//当b和d为同一个值的时候,变量空间被复用了,

在clang的理解中

a = (b=c)+(d=e)
//被改写成了
i=b=c
j=d=e
a=i+j
//所以直接得到了赋值符号右边表达式值之和

由此得出结论:赋值表达式的返回值为赋值符号右边的值。

但在某些特殊情况下,使用某些编译器可能无法得到想要的结果。所以我们应当尽量避免使用赋值表达式的值参与运算。

注意:虽然在两个例子中,a的值都是3,但这并不意味着表达式的求值顺序是从左往右的。

有关编译器求值顺序的详细内容可以参考这篇文章