union用法解析及数据类型在不同平台上的字节数

时间:2023-01-11 18:36:01

union 关键字的用法与struct 的用法非常类似。

union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间只能储存其中一个数据成员,所有的数据成员具有相同的起始地址。例子如下:
union StateMachine
{
   char character;
   int number;
   char *str;
   double exp;
};

一个union 只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是double 型态,所以StateMachine 的空间大小就是double 数据类型的大小。

在C++里,union 的成员默认属性页为public。union 主要用来压缩空间。如果一些数据不可能在同一时间同时被用到,则可以使用union。

一、大小端模式对union 类型数据的影响

下面再看一个例子:
union
{
   int i;
   char a[2];
}*p, u;
p =&u;
p->a[0] = 0x39;
p->a[1] = 0x38;

p.i 的值应该为多少呢?

这里需要考虑存储模式:大端模式和小端模式。
  1. 大端模式(Big_endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中。
  2. 小端模式(Little_endian):字数据的高字节存储在高地址中,而字数据的低字节则存放在低地址中。
union 型数据所占的空间等于其最大的成员所占的空间。对union 型的成员的存取都是相对于该联合体基地址的偏移量为0 处开始,也就是联合体的访问不论对哪个变量的存取都是从union 的首地址位置开始。如此一解释,上面的问题是否已经有了答案呢?

二、如何用程序确认当前系统的存储模式?

上述问题似乎还比较简单,那来个有技术含量的:请写一个C 函数,若处理器是Big_endian 的,则返回0;若是Little_endian 的,则返回1。

先分析一下,按照上面关于大小端模式的定义,假设int 类型变量i 被初始化为1。

以大端模式存储,其内存布局如下图:
union用法解析及数据类型在不同平台上的字节数
以小端模式存储,其内存布局如下图:
union用法解析及数据类型在不同平台上的字节数
变量i 占4 个字节,但只有一个字节的值为1,另外三个字节的值都为0。如果取出低地址上的值为0,毫无疑问,这是大端模式;如果取出低地址上的值为1,毫无疑问,这是小端模式。既然如此,我们完全可以利用union 类型数据的特点:所有成员的起始地址一致。

到现在,应该知道怎么写了吧?参考答案如下:
int checkSystem( )
{
   union check
   {
      int i;
      char ch;
   } c;
   c.i = 1;
   return (c.ch ==1);
}

现在你可以用这个函数来测试你当前系统的存储模式了。当然你也可以不用函数而直接去查看内存来确定当前系统的存储模式。如下图:
union用法解析及数据类型在不同平台上的字节数
图中0x01 的值存在低地址上,说明当前系统为小端模式。

不过要说明的一点是,某些系统可能同时支持这两种存储模式,你可以用硬件跳线或在编译器的选项中设置其存储模式。

转:http://see.xidian.edu.cn/cpp/html/450.html

============================================================================

联合提供了一种方式,能够规避C的类型系统,允许以多种类型来引用一个对象。联合声明的语法和结构体的语法一样,只不过语义相差很大。它们不是用不同的域来引用不同的存储器块,而是引用同一块存储块。

下面我们来举几个例子:

struct STest

{

       char   c;

       int    i[ 2 ];

       double var;

};

union UTest

{

       char   c;

       int    i[ 2 ];

       double var;

};

我们可以查看内存里面的分布:

类型         c     i    var    大小        

STest     0     4    12     20

UTest     0     0    0      8

上面的数据表示距离首地址的存储器块偏移。假如我们定义了UTest* pU; 我们分别察看p->c;  p->i[ 0 ];  p->var; 它们所引用的都是数据结构的起始位置。当然求sizeof的话。UTest的大小将是它的最大类型的数据成员的大小。

           联合的用处很多:

1)这里举一个怎么用它来节省空间:

假设我们有一个二叉树的数据结构,每个叶子节点都有一个double的数据值,而每个内部节点都有指向孩子节点的指针,但是没有数据(因为是叶子节点)。如果我们像这样声明:

struct NODE

{

       struct NODE* pLeft;

       struct NODE* pRight;

       double       data;

};

我们可以知道这样一个结构体需要16个字节,每个叶子节点都会浪费一半的字节。相反,如果我们用联合来声明一个节点:

union NODE

{

       struct

       {

              union NODE* pLeft;

              union NODE* pRight;

       }inter;

       double data;

};

这样一来,每个节点就只需要8个字节。如果pNode是一个指向union NODE类型的指针,我们用pNode->data来引用叶子节点的数据。而pNode->inter.pLeft和pNode->inter.pRight来引用内部节点的孩子。

这样可能出现一种情况,就是无法确定是哪种节点(内部节点或叶子节点)。我们可以引用一个标志域。

struct NODE

{

       BOOL  isLeaf;

       union

       {

              struct

              {

                     union NODE* pLeft;

                     union NODE* pRight;

              }inter;

              double data;

       }info;

}

不过对于这样小的节省而导致代码的可读性变得差了一些。在这里联合带来的好处可以忽略。对于较多域的数据结构,这样的节省会更加吸引人一些。

 2)还有一个用法就是用来访问不同数据类型的位。如:

UINT floatToBits( float fVar )

{

       union

       {

               float  fV;

               UINT uI;

       }temp;

       temp.fV = fVar;

       return temp.uI;

}

我们看看汇编代码:

mov         eax,dword ptr [ fVar ]

mov         dword ptr [ temp ],eax

它跟下面的函数产生回汇编代码是一样的:

UINT floatToBits( UINT var )

{

       return var;

}

这就证明汇编代码里面缺乏信息,无论是什么类型都相对于EBP偏移固定的值。过程只是简单的拷贝,并没有修改任何位。

3)再举个例子吧://可以用来判断big-endian和little-endian

double bitToDouble( UINT uParam1, UINT uParam2 )

{

       union

       {

               double d;

               UINT u[ 2 ];  

       }temp;

       temp.u[ 0 ] = uParam1;

       temp.u[ 1 ] = uParam2;

       return temp.d;

}

好了,更多的用法大家在慢慢体会吧。

转;http://blog.csdn.net/masefee/article/details/4160211

==========================================

数据类型对应字节数(32位,64位 int 占字节数)

一、程序运行平台

       不同的平台上对不同数据类型分配的字节数是不同的。
       个人对平台的理解是CPU+OS+Compiler,是因为: 
       1、64位机器也可以装32位系统(x64装XP); 
       2、32位机器上可以有16/32位的编译器(XP上有tc是16位的,其他常见的是32位的); 
       3、即使是32位的编译器也可以弄出64位的integer来(int64)。 
       以上这些是基于常见的wintel平台,加上我们可能很少机会接触的其它平台(其它的CPU和OS),所以个人认为所谓平台的概念是三者的组合。 
       虽然三者的长度可以不一样,但显然相互配合(即长度相等,32位的CPU+32位的OS+32位的Compiler)发挥的能量最大。 
       理论上来讲 我觉得数据类型的字节数应该是由CPU决定的, 但是实际上主要由编译器决定(占多少位由编译器在编译期间说了算)

二、常用数据类型对应字节数
       可用如sizeof(char),sizeof(char*)等得出

       32位编译器:

       char :1个字节
       char*(即指针变量): 4个字节(32位的寻址空间是2^32, 即32个bit,也就是4个字节。同理64位编译器)
       short int : 2个字节
       int: 4个字节
       unsigned int : 4个字节
       float: 4个字节
       double: 8个字节
       long: 4个字节
       long long: 8个字节
       unsigned long: 4个字节

       64位编译器:

       char :1个字节
       char*(即指针变量): 8个字节
       short int : 2个字节
       int: 4个字节
       unsigned int : 4个字节
       float: 4个字节
       double: 8个字节
       long: 8个字节
       long long: 8个字节
       unsigned long: 8个字节
原文:http://www.cnblogs.com/augellis/archive/2009/09/29/1576501.html