数组、结构体、类的反汇编

本文主要主要研究C++中数组，结构以及类的反汇编。

1.数组

数组在内存中式一块连续的区域。比如当声明char ch[100]的时候，我们知道栈是向下增长的，所以我们开辟地址空间的时候起地址就为[esp(esp会赋值给ebp) – 100, esp].我们可以看下如下的列子：

我们看下他的反汇编代码：

  
  
  
   
   
   
   
   
    1 
   
   
    
   
   
   char
   
   
    buf[
   
   
   100
   
   
   ]; 

   
   
    2 
   
   
    
   
   
   for
   
   
    (
   
   
   int
   
   
    i 
   
   
   =
   
   
    
   
   
   0
   
   
   ; i 
   
   
   <
   
   
    
   
   
   100
   
   
   ; i
   
   
   ++
   
   
   ) 

   
   
    3 
   
   
   00BD13A8 mov dword ptr [i],
   
   
   0
   
   
    

   
   
    4 
   
   
   00BD13AF jmp wmain
   
   
   +
   
   
   3Ah (0BD13BAh) 

   
   
    5 
   
   
   00BD13B1 mov eax,dword ptr [i] 

   
   
    6 
   
   
   00BD13B4 add eax,
   
   
   1
   
   
    

   
   
    7 
   
   
   00BD13B7 mov dword ptr [i],eax 

   
   
    8 
   
   
   00BD13BA cmp dword ptr [i],64h 

   
   
    9 
   
   
   00BD13BE jge wmain
   
   
   +
   
   
   4Ch (0BD13CCh) 
   
   
   //
   
   
   到这里是一个典型的for循环标志了 
   
   
   

   
   
   10 
   
   
    
   
   
    buf[i] 
   
   
   =
   
   
    i; 

   
   
   11 
   
   
   00BD13C0 mov eax,dword ptr [i] 
   
   
   //
   
   
   把当前i的值赋予eax，这个eax是用来计算内存位置的 
   
   
   

   
   
   12 
   
   
    
   
   
   00BD13C3 mov cl,
   
   
   byte
   
   
    ptr [i] 
   
   
   //
   
   
    因为是char型，所以复制给cl， 这个是给内存赋值的 
   
   
   

   
   
   13 
   
   
    
   
   
   00BD13C6 mov 
   
   
   byte
   
   
    ptr [ebp
   
   
   +
   
   
   eax
   
   
   -
   
   
   6Ch],cl 
   
   
   //
   
   
   计算当前buf[i]在栈中的位置，并赋值 
   
   
   

   
   
   14 
   
   
    
   
   
   00BD13CA jmp wmain
   
   
   +
   
   
   31h (0BD13B1h)

从上面我们就可以知道buf[0] = [ebp-100]; buf[1] = [ebp -99]……

2.结构体

我们声明这样一个结构体

然后调用之:

  
  
  
   
   
   
   
   
    1 
   
   
   int
   
   
    _tmain(
   
   
   int
   
   
    argc, _TCHAR
   
   
   *
   
   
    argv[]) 

   
   
    2 
   
   
   {

   
   
    3 
   
   
    
   
   
   int
   
   
    n 
   
   
   =
   
   
    
   
   
   sizeof
   
   
   (myStruct); 

   
   
    4 
   
   
    n 
   
   
   =
   
   
    
   
   
   sizeof
   
   
   (
   
   
   float
   
   
   );

   
   
    5 
   
   
    myStruct test; 

   
   
    6 
   
   
    test.a 
   
   
   =
   
   
    
   
   
   0
   
   
   ; 

   
   
    7 
   
   
    test.b 
   
   
   =
   
   
    
   
   
   '
   
   
   a
   
   
   '
   
   
   ; 

   
   
    8 
   
   
    test.c 
   
   
   =
   
   
    
   
   
   1.0f
   
   
   ;

   
   
    9 
   
   
    
   
   
   return
   
   
    
   
   
   0
   
   
   ; 

   
   
   10 
   
   
   }

我们看下其内存是如何分布的：

  
  
  
   
   
   
   
   
    1 
   
   
    
   
   
   int
   
   
    n 
   
   
   =
   
   
    
   
   
   sizeof
   
   
   (myStruct); 

   
   
    2 
   
   
   00FB13A8 mov dword ptr [ebp
   
   
   -
   
   
   0Ch],0Ch 

   
   
    3 
   
   
    n 
   
   
   =
   
   
    
   
   
   sizeof
   
   
   (
   
   
   float
   
   
   ); 

   
   
    4 
   
   
   00FB13AF mov dword ptr [ebp
   
   
   -
   
   
   0Ch],
   
   
   4
   
   
    

   
   
    5 
   
   
    myStruct test; 

   
   
    6 
   
   
    test.a 
   
   
   =
   
   
    
   
   
   0
   
   
   ; 

   
   
    7 
   
   
   00FB13B6 mov dword ptr [ebp
   
   
   -
   
   
   20h],
   
   
   0
   
   
    

   
   
    8 
   
   
    test.b 
   
   
   =
   
   
    
   
   
   '
   
   
   a
   
   
   '
   
   
   ; 

   
   
    9 
   
   
   00FB13BD mov 
   
   
   byte
   
   
    ptr [ebp
   
   
   -
   
   
   1Ch],61h 

   
   
   10 
   
   
    test.c 
   
   
   =
   
   
    
   
   
   1.0f
   
   
   ; 

   
   
   11 
   
   
   00FB13C1 fld1 

   
   
   12 
   
   
   00FB13C3 fstp dword ptr [ebp
   
   
   -
   
   
   18h]

我们可以看出这个结构体的大小为OCH(12), float的大小为4, int为4， char为1，考虑到内存对齐，大小就得为4的整数倍，所以为12。

test.a 在内存中的位置为[ebp-20h]；

test.b 在内存中的位置为[ebp-2Ch]；

test.C 在内存中的位置为[ebp-28h]；

3. 类

C++中的类与结构体没有本质上的区别。都是在某一内存地址上开辟地址空间，存放和操作成员变量。我们可以看下如下的测试代码：

  
  
  
   
   
   
   
   
    1 
   
   
   class
   
   
    myClass 

   
   
    2 
   
   
   { 

   
   
    3 
   
   
    
   
   
   private
   
   
   : 

   
   
    4 
   
   
    
   
   
   int
   
   
    m_a; 

   
   
    5 
   
   
    
   
   
   char
   
   
    m_b; 

   
   
    6 
   
   
    
   
   
   float
   
   
    m_c; 

   
   
    7 
   
   
    
   
   
   public
   
   
   : 

   
   
    8 
   
   
    myClass(){}

   
   
    9 
   
   
    
   
   
   ~
   
   
   myClass(){}

   
   
   10 
   
   
    
   
   
   void
   
   
    SetA(
   
   
   int
   
   
    a) 

   
   
   11 
   
   
    { 

   
   
   12 
   
   
    m_a 
   
   
   =
   
   
    a; 

   
   
   13 
   
   
    } 

   
   
   14 
   
   
    
   
   
   virtual
   
   
    
   
   
   void
   
   
    SetB(
   
   
   char
   
   
    b) 

   
   
   15 
   
   
    { 

   
   
   16 
   
   
    m_b 
   
   
   =
   
   
    b; 

   
   
   17 
   
   
    } 

   
   
   18 
   
   
    
   
   
   virtual
   
   
    
   
   
   void
   
   
    SetC(
   
   
   float
   
   
    c) 

   
   
   19 
   
   
    { 

   
   
   20 
   
   
    m_c 
   
   
   =
   
   
    c; 

   
   
   21 
   
   
    } 

   
   
   22 
   
   
   };

看下其反汇编的实现：

  
  
  
   
   
   
   
   
    1 
   
   
    
   
   
   int
   
   
    n 
   
   
   =
   
   
    
   
   
   sizeof
   
   
   (myClass); 

   
   
    2 
   
   
   0030144D mov dword ptr [ebp
   
   
   -
   
   
   14h],10h 

   
   
    3 
   
   
    myClass test; 

   
   
    4 
   
   
    
   
   
   00301454
   
   
    lea ecx,[ebp
   
   
   -
   
   
   2Ch] 

   
   
    5 
   
   
    
   
   
   00301457
   
   
    call myClass::myClass (301028h) 

   
   
    6 
   
   
   0030145C mov dword ptr [ebp
   
   
   -
   
   
   4
   
   
   ],
   
   
   0
   
   
    

   
   
    7 
   
   
    test.SetA(
   
   
   10
   
   
   ); 

   
   
    8 
   
   
    
   
   
   00301463
   
   
    push 0Ah 

   
   
    9 
   
   
    
   
   
   00301465
   
   
    lea ecx,[ebp
   
   
   -
   
   
   2Ch] 

   
   
   10 
   
   
    
   
   
   00301468
   
   
    call myClass::SetA (301014h) 

   
   
   11 
   
   
    test.SetB(
   
   
   '
   
   
   a
   
   
   '
   
   
   ); 

   
   
   12 
   
   
   0030146D push 61h 

   
   
   13 
   
   
   0030146F lea ecx,[ebp
   
   
   -
   
   
   2Ch] 

   
   
   14 
   
   
    
   
   
   00301472
   
   
    call myClass::SetB (3011EFh) 

   
   
   15 
   
   
    test.SetC(
   
   
   1.0f
   
   
   ); 

   
   
   16 
   
   
    
   
   
   00301477
   
   
    push ecx 

   
   
   17 
   
   
    
   
   
   00301478
   
   
    fld1 

   
   
   18 
   
   
   0030147A fstp dword ptr [esp] 

   
   
   19 
   
   
   0030147D lea ecx,[ebp
   
   
   -
   
   
   2Ch] 

   
   
   20 
   
   
    
   
   
   00301480
   
   
    call myClass::SetC (301104h) 

   
   
   21 
   
   
    
   
   
   return
   
   
    
   
   
   0
   
   
   ; 

   
   
   22 
   
   
    
   
   
   00301485
   
   
    mov dword ptr [ebp
   
   
   -
   
   
   0F8h],
   
   
   0
   
   
    

   
   
   23 
   
   
   0030148F mov dword ptr [ebp
   
   
   -
   
   
   4
   
   
   ],0FFFFFFFFh 

   
   
   24 
   
   
    
   
   
   00301496
   
   
    lea ecx,[ebp
   
   
   -
   
   
   2Ch] 

   
   
   25 
   
   
    
   
   
   00301499
   
   
    call myClass::
   
   
   ~
   
   
   myClass (3010BEh) 

   
   
   26 
   
   
   0030149E mov eax,dword ptr [ebp
   
   
   -
   
   
   0F8h]

这里先稍微解释下其意思：

# 0030144D 表明这个类的大小为16，那位什么不是如上结构体的为12呢，一问类中用到虚函数，所以就有一个指向虚函数列表的指针，其大小为4。

# 00301457 变量调用了该类的构造函数

# 00301468 调用了SetA

# 00301472 调用了SetB

# 00301499 调用了析构函数

我们分别来看下着四个函数内部的实现。

(1) 构造函数

  
  
  
   
   
   
   
   
   1 
   
   
   00301550
   
   
    mov dword ptr [ebp
   
   
   -
   
   
   8
   
   
   ],ecx 

   
   
   2 
   
   
    
   
   
   00301553
   
   
    mov eax,dword ptr [
   
   
   this
   
   
   ] 
   
   
   //
   
   
   首先我们把this指针放入eax中 
   
   
   

   
   
   3 
   
   
   00301556
   
   
    mov dword ptr [eax],offset myClass::`vftable
   
   
   '
   
   
    (306744h)  
  
  
  
  
  
  
   
   
    //然后把虚函数列表的地址放入[eax]中 
   
   
   

   
   
   4 
   
   
   0030155C mov eax,dword ptr [
   
   
   this
   
   
   ]

如上，我们可以看出此类的构造函数只是简单得把虚函数列表的指针指向[this]的地址。

(2) SetA

这个函数是一个的成员函数，我们看下其是如何实现的

  
  
  
   
   
   
   
   
   1 
   
   
   003015E3 mov eax,dword ptr [
   
   
   this
   
   
   ] 

   
   
   2 
   
   
   003015E6 mov ecx,dword ptr [a] 

   
   
   3 
   
   
   003015E9 mov dword ptr [eax
   
   
   +
   
   
   4
   
   
   ],ecx

如上，可以看出很简单，把参数a的值服务[this + 4]这块地址，而这块地址保存的是成员变量m_a的值。

(3) SetB

SetB是一个虚函数，我们看下其实如何实现的：

  
  
  
   
   
   
   
   
   1 
   
   
   00301633
   
   
    mov eax,dword ptr [
   
   
   this
   
   
   ] 

   
   
   2 
   
   
   00301636
   
   
    mov cl,
   
   
   byte
   
   
    ptr [b] 

   
   
   3 
   
   
   00301639
   
   
    mov 
   
   
   byte
   
   
    ptr [eax
   
   
   +
   
   
   8
   
   
   ],cl

如上可以发现，虚函数的内部实现和普通的函数没有区别，唯一不同的是虚函数的位置是放在一个类的虚函数列表里面的。

(4) 析构函数

最后我们看下此类的析构函数是怎么实现的

  
  
  
   
   
   
   
   
   1 
   
   
   003015A0 mov dword ptr [ebp
   
   
   -
   
   
   8
   
   
   ],ecx 

   
   
   2 
   
   
   003015A3 mov eax,dword ptr [
   
   
   this
   
   
   ] 

   
   
   3 
   
   
   003015A6 mov dword ptr [eax],offset myClass::`vftable
   
   
   '
   
   
    (306744h)

因为我们在析构函数中什么事情也没有干，所以此析构函数只是简单的吧虚函数列表的地址放到[this]中。

这里我总结下声明一个类其内存是如何分配的：

# 当写下myStruct test;的时候会在栈上开辟一个内存空间，其地址为[this]

# 如果此类有虚函数，就有有一个指向此类虚函数列表的指针，其地址为[this ]

# m_a 的地址为[this +4]

# m_b 的地址为[this + 8]

# m_c 的地址为[this + 0Ch]

秒客网

数组、结构体、类的反汇编

1.数组

2.结构体

3. 类

相关文章