汇编语言比C语言运行快多少?

时间:2021-06-03 01:08:42
本人有一个问题:

设计了一个图象处理软件,用C语言写的图象处理软件,运行时间为1秒,能否将这段程序改写为汇编语言,运行时间能达到100ms, 怎样将汇编语言嵌入到VC++中,

请向各位大侠请教!!!!!!!1

10 个解决方案

#1


具体快多少每算过
不过汇编书上有写具体哪个指令执行几个机器周期

在c中嵌入汇编应该是
_asm{}

#2


是不是汇编要比VC快呢?
关于Vc++中嵌入汇编,能说的更详细点儿吗?(在线等候)
急切盼复,谢谢

#3


不一定会快,现在的编译器优化的很好,
另外如果你的 VC 代码优化的很好,用汇编不一定能快。

嵌入,如:
   int p;
   _asm{
        mov P,eax;
        shl p,1;
   }

#4


1秒 --> 100ms, 恐怕要改进算法.

#5


如果想达到1S->100ms,如果你原来的编译器不是VC还好说,不然的话就算在汇编里用MMX指令也比较难达到这种程度。。。我曾经也是这样想用汇编把我的一段处理量较大的代码改成汇编的,结果速度反而没有VC优化的快,不过使用了MMX指令就会快一点了。

#6


在Visual C++中使用内联汇编 

一、内联汇编的优缺点 

   因为在Visual C++中使用内联汇编不需要额外的编译器和联接器,且可以处理Visual C++中不能处理的一些事情,而且可以使用在C/C++中的变量,所以非常方便。内联汇编主要用于如下场合: 

   1.使用汇编语言写函数; 
   2.对速度要求非常高的代码; 
   3.设备驱动程序中直接访问硬件; 
   4."Naked" Call的初始化和结束代码。 
     //(."Naked",理解了意思,但是不知道怎么翻译^_^,大概就是不需要C/C++的编译器(自作聪明)生成的函数初始化和收尾代码,请参看MSDN的"Naked Functions"的说明) 

   内联汇编代码不易于移植,如果你的程序打算在不同类型的机器(比如x86和Alpha)上运行,应当尽量避免使用内联汇编。这时候你可以使用MASM,因为MASM支持更方便的的宏指令和数据指示符。 


二、内联汇编关键字 

   在Visual C++使用内联汇编用到的是__asm关键字,这个关键字有两种使用方法: 

   1.简单__asm块 
       __asm 
       { 
           MOV     AL, 2 
           MOV     DX, 0XD007 
           OUT     AL, DX 
       } 

   2.在每条汇编指令之前加__asm关键字 
       __asm MOV   AL, 2 
       __asm MOV   DX, 0xD007 
       __asm OUT   AL, DX 

   因为__asm关键字是语句分隔符,因此你可以把汇编指令放在同一行: 
       __asm MOV AL, 2     __asm MOV DX, 0XD007    __asm OUT AL, DX 

   显然,第一种方法和C/C++的风格很一致,并且有很多其它优点,因此推荐使用第一种方法。 

   不象在C/C++中的"{}",__asm块的"{}"不会影响C/C++变量的作用范围。同时,__asm块可以嵌套,嵌套也不会影响变量的作用范围。 



三、在__asm块中使用汇编语言 

   1.内联汇编指令集 
   内联汇编完全支持的Intel 486指令集,允许使用MMX指令。不支持的指令可以使用_EMIT伪指令定义(_EMIT伪指令说明见下文)。 

   2.MASM表达式 
   内联汇编可以使用MASM中的表达式。比如: MOV EAX, 1。 

   3.数据指示符和操作符 
   虽然__asm块中允许使用C/C++的数据类型和对象,但它不能用MASM指示符和操作符定义数据对象。这里特别指出,__asm块中不允许MASM中的定义指示符: DB、DW、DD、DQ、DT和DF,也不允许DUP和THIS操作符。MASM结构和记录也不再有效,内联汇编不接受STRUC、RECORD、WIDTH或者MASK。 

   4.EVEN和ALIGN指示符 
   尽管内联汇编不支持大多数MASM指示符,但它支持EVEN和ALIGN,当需要的时候,这些指示符在汇编代码里面加入NOP(空操作)指令使标号对齐到特定边界。这样可以使某些处理器取指令时具有更高的效率。 

   5.MASM宏指示符 
   内联汇编不是宏汇编,不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏操作符(<>、!、&、%和.TYPE)。 

   6.段说明 
   必须使用寄存器来说明段,跨越段必须显式地说明,如ES:[BX]。 

   7.类型和变量大小 
   我们可以使用LENGTH来取得C/C++中的数组中的元素个数,如果不是一个数组,则结果为一。使用SIZE来取得C/C++中变量的大小,一个变量的大小是LENGTH和TYPE的乘积。TYPE用来取得一个变量的大小,如果是一个数组,它得到的一个数组中的单个元素的大小。 

   8.注释 
   可以使用C/C++的注释,但推荐用ASM的注释,即";"号。 

   9._EMIT伪指令 
   _EMIT伪指令相当于MASM中的DB,但一次只能定义一个字节,比如: 
       __asm 
       { 
           JMP     _CodeOfAsm 

           _EMIT   0x00    ; 定义混合在代码段的数据 
           _EMIT   0x01 

       _CodeOfAsm: 
           ; 这里是代码 
           _EMIT   0x90    ; NOP指令 
       } 



四、在__asm块中使用C/C++语言元素 

   C/C++与汇编可以混合使用,在内联汇编可以使用C/C++的变量和很多其它C/C++的元素。在__asm块中可以使用以下C/C++元素: 

   1.符号,包括标号、变量和函数名; 

   2.常量,包括符号常量和枚举型(enum)成员; 

   3.宏定义和预处理指示符; 

   4.注释,包括"/**/"和"//"; 

   5.类型名,包括所有MASM中合法的类型 

   6.typedef名称, 像PTR、TYPE、特定的结构成员或枚举成员这样的通用操作符。 

   在__asm块中,可以使用C/C++或ASM的基数计数法(比如: 0x100和100H是相等的)。 

   __asm块中不能使用像<<一类的C/C++操作符。C/C++和MASM通用的操作符,比如"*"和"[]"操作符,都被认为是汇编语言的操作符。举个例子: 

       int array[10]; 

       __asm MOV array[6], BX ;  Store BX at array+6 (not scaled) 

       array[6] = 0;         /* Store 0 at array+12 (scaled) */ 

   * 小技巧: 内联汇编中,你可以使用TYPE操作符使作其与C一致。比如,下面两条语句是一样的: 

       __asm MOV array[6 * TYPE int], 0 ; Store 0 at array + 12 

       array[6] = 0;                   /* Store 0 at array + 12 */ 

   内联汇编能通过变两名直接引用C/C++的变量。__asm块中可以引用任何符号,包括变量名。 

   如果C/C++中的类、结构或者枚举成员具有唯一的名称,如果在"."操作符之前不指定变量或者typedef名称,则__asm块中只能引用成员名称。然而,如果成员不是唯一的,你必须在"."操作符之前加上变量名或typedef名称。例如,下面的两个结构都具有same_name这个成员变量: 

       struct first_type 
       { 
           char *weasel; 
           int same_name; 
       }; 

       struct second_type 
       { 
           int wonton; 
           long same_name; 
       }; 

   如果按下面声明变量: 

       struct first_type hal; 
       struct second_type oat; 

   那么,所有引用same_name成员的地方都必须使用变量名,因为same_name不是唯一的。另外,上面的weasel变量具有唯一的名称,你可以仅仅使用它的成员名称来引用它: 

       __asm 
       { 
           MOV EBX, OFFSET hal 
           MOV ECX, [EBX]hal.same_name ; 必须使用 'hal' 
           MOV ESI, [EBX].weasel       ; 可以省略 'hal' 
       } 

   注意,省略了变量名仅仅是为了写代码的方便,生成的汇编指令的还是一样的。 

   可以不受限制地访问C++成员变量,但是不能调用C++的成员函数。 



五、寄存器使用 

   一般来说,在__asm块开始的时候,寄存器是空的,不能在两个__asm之间保存寄存器的值。(这是MSDN上说的,我在实际使用时发现,好像并不是这样。不过它是说"一般",我是特殊:)) 

   如果一个函数被声明成了__fastcall,则其参数将放在寄存器中,这将给寄存器的管理带来问题。所以,如果要将一个函数声明成__fastcall,必须保存ECX寄存器。为了避免以上的冲突,在声明为__fastcall的函数中不要有__asm块。如果用了/Gr编译选项(它全局的变成__fastcall),将每个函数声明成__cdecl或者__stdcall,这个属性告诉编译器用传统的C方法。 

   如果使用EAX、EBX、ECX、EDX、ESI和EDI寄存器,你不需要保存它;但如果你用到了DS、 SS、SP、BP和标志寄存器,那就应该PUSH保存这些寄存器。 

   如果程序中改变了用于STD和CLD的方向标志,你必须将其恢复到原来的值。 




六、转跳 

   可以在C里面使用goto调到__asm块中的标号处,也可以在__asm块中转跳到__asm块里面和外面的标号处。__asm块内的标号是不区分大小写的(指令、指示符等也是不区分大小写的)。例: 

       void func() 
       { 
               goto C_Dest;    /* 合法 */ 
               goto c_dest;    /* 错误 */ 

               goto A_Dest;    /* 合法 */ 
               goto a_dest;    /* 合法 */ 

               __asm 
               { 
                       JMP C_Dest  ; 合法 
                       JMP c_dest  ; MSDN上说合法,但是我在VS.NET中编译,认为这样不合法 

                       JMP A_Dest  ; 合法 
                       JMP a_dest  ; 合法 

       a_dest:     ; __asm 标号 
               } 

       C_Dest:     /* C的标号 */ 
       return; 
       } 


   不要使用函数名称当作标号,否则将使其跳到函数执行而不是标号处。如下所示: 

       ; 错误: 使用函数名作为标号 
       JNE exit 
       . 
       . 
       . 
       exit: 
       ; 下面是更多的ASM代码 


   美元符号$用于指定当前位置,如下所用,常用于条件跳转: 

       JNE $+5 ; 下面这条指令的长度是5个字节 
       JMP farlabel 
       ;$+5,跳到了这里 
       . 
       . 
       . 
       farlabel: 



七、调用函数 

   内联汇编调用C/C++函数必须自己清除堆栈,下面是一个调用C/C++函数例子: 

       #include <stdio.h> 

       char szformat[] = "%s %s\n"; 
       char szHello[] = "Hello"; 
       char szWorld[] = " world"; 
       void main() 
       { 
           __asm 
           { 
               MOV     EAX, OFFSET szWorld 
               PUSH    EAX 
               MOV     EAX, OFFSET szHello 
               PUSH    EAX 
               MOV     EAX, OFFSET szformat 
               PUSH    EAX 
               CALL    printf 

               //内联汇编调用C函数必须自己清除堆栈 
               //用不使用的EBX寄存器清除堆栈,或ADD ESP, 12 
               POP     EBX 
               POP     EBX 
               POP     EBX 
           } 
       } 

   注意:函数参数是从右向左压栈。 

#7


八、一个例子 

   下面的例子是在VS.NET(即VC7)中C语言写的。先建一个工程,将下列代码放到工程中的.c文件中编译,无需作特别的设置,即可编译通过。 

   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //预处理 
   #include <Windows.h> 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 


   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //全局变量 
   HWND g_hWnd; 
   HINSTANCE g_hInst; 

   TCHAR szTemp[1024]; 

   TCHAR szAppName[] = "CRC32 Sample"; 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 


   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //函数声明 
   DWORD GetCRC32(const BYTE *pbData, int nSize); 
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow); 
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam); 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 




   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //主函数 
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow) 
   { 
       MSG msg; 
       WNDCLASSEX wndClassEx; 

       g_hInst = hInstance; 

       wndClassEx.cbSize = sizeof(WNDCLASSEX); 
       wndClassEx.style = CS_VREDRAW | CS_HREDRAW; 
       wndClassEx.lpfnWndProc = (WNDPROC) WindowProc; 
       wndClassEx.cbClsExtra = 0; 
       wndClassEx.cbWndExtra = 0; 
       wndClassEx.hInstance = g_hInst; 
       wndClassEx.hIcon = LoadIcon(NULL, IDI_APPLICATION); 
       wndClassEx.hCursor = LoadCursor(NULL, IDC_ARROW); 
       wndClassEx.hbrBackground = (HBRUSH) (COLOR_WINDOW); 
       wndClassEx.lpszMenuName = NULL; 
       wndClassEx.lpszClassName = szAppName; 
       wndClassEx.hIconSm = NULL; 

       RegisterClassEx(&wndClassEx); 

       g_hWnd = CreateWindowEx(0, szAppName, szAppName, WS_OVERLAPPED | WS_CAPTION | WS_SYSMENU | WS_THICKFRAME | WS_MINIMIZEBOX, 
           CW_USEDEFAULT, CW_USEDEFAULT, 300, 70, 
           NULL, NULL, g_hInst, NULL); 

       ShowWindow(g_hWnd, iCmdShow); 
       UpdateWindow(g_hWnd); 

       while (GetMessage(&msg, NULL, 0, 0)) 
       { 
           TranslateMessage(&msg); 
           DispatchMessage(&msg); 
       } 
       return ((int) msg.wParam); 
   } 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 



   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //主窗口回调函数 
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam) 
   { 
       switch (uMsg) 
       { 
       case WM_CREATE: 
           CreateWindowEx(WS_EX_CLIENTEDGE, "EDIT", NULL, WS_CHILD | WS_VISIBLE | WS_BORDER | ES_AUTOHSCROLL | ES_AUTOVSCROLL | ES_NOHIDESEL | WS_OVERLAPPED, 
               7, 12, 220, 22, 
               hWnd, (HMENU)1000, g_hInst, NULL); 
           CreateWindowEx(0, "BUTTON", "&OK", WS_CHILD | WS_VISIBLE | BS_PUSHBUTTON | WS_OVERLAPPED | BS_FLAT, 
               244, 12, 40, 20, 
               hWnd, (HMENU)IDOK, g_hInst, NULL); 

           break; 

       case WM_COMMAND: 
           switch (LOWORD(wParam)) 
           { 
           case IDOK: 
               GetDlgItemText(g_hWnd, 1000, szTemp + 100, 800); 
               wsprintf(szTemp, "当前文本框内的字符串的CRC32校验码是: 0x%lX", GetCRC32(szTemp + 100, (int)strlen(szTemp + 100))); 
               MessageBox(g_hWnd, szTemp, szAppName, MB_OK|MB_ICONINformATION); 
           } 
           break; 

       case WM_DESTROY: 
           PostQuitMessage(0); 
           break; 

       default: 
           return (DefWindowProc(hWnd, uMsg, wParam, lParam)); 
       } 
       return (0); 
   } 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 




   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //GetCRC32: 求字节流的CRC32校验码 
   //参数: 
   //      pbData: 指向字节流缓冲区首地址 
   //      nSize: 字节流长度 
   // 
   //返回值: 
   //      字节流的CRC32校验码 
   // 
   //这里使用查表法求CRC32校验码,这部分是参考老罗的文章《 矛与盾的较量(2)——CRC原理篇》该写的。 
   //原文的具体内容请参看: http://asp.7i24.com/netcool/laoluo/articles/show_article.asp?Article_ID=15 
   // 
   //下面使用内联汇编求CRC32校验码,充分使用了CPU中的寄存器,速度和方便性都是使用C/C++所不能比拟的 
   // 
   DWORD GetCRC32(const BYTE *pbData, int nSize) 
   { 
       DWORD dwCRC32Table[256]; 

       __asm   //这片内联汇编是初始化CRC32表 
       { 
           MOV     ECX, 256 

   _NextTable: 
           LEA     EAX, [ECX-1] 
           PUSH    ECX 
           MOV     ECX, 8 

   _NextBit: 
           SHR     EAX, 1 
           JNC     _NotCarry 
           XOR     EAX, 0xEDB88320 
   _NotCarry: 
           DEC     ECX 
           JNZ     _NextBit 

           POP     ECX 
           MOV     [dwCRC32Table + ECX*4 - 4], EAX 
           DEC     ECX 
           JNZ     _NextTable 
       } 

       __asm   //下面是求CRC32校验码 
       { 
           MOV     EAX, -1 
           MOV     EBX, pbData 
           OR      EBX, EBX 
           JZ      _Done 
           MOV     ECX, nSize 
           OR      ECX, ECX 
           JZ      _Done 

   _NextByte: 
           MOV     DL, [EBX] 

           XOR     DL, AL 
           MOVZX   EDX, DL 
           SHR     EAX, 8 
           XOR     EAX, [dwCRC32Table + EDX*4] 

           INC     EBX 
           LOOP    _NextByte 
   _Done: 
           NOT     EAX 
       } 
   } 
   ////////////////////////////////////////////////////////////////////////////////////////////////////

#8


从算法入手吧,想靠汇编提高一个数量级,那得汇编大牛才可能超越vc优化代码

#9


忘了,还与机器相关的

#10


我觉得如果仅对内存中的数据进行处理,用汇编更快些。

如果对外存中的文件进行处理,当汇编程序中不设置磁盘缓冲区时速度比不上C。
(我有的是MASM 和 TURBO C 2。0),可能是TC的编译程序自动设置了磁盘缓冲区。

也得看你用的汇编程序和编译程序。

#1


具体快多少每算过
不过汇编书上有写具体哪个指令执行几个机器周期

在c中嵌入汇编应该是
_asm{}

#2


是不是汇编要比VC快呢?
关于Vc++中嵌入汇编,能说的更详细点儿吗?(在线等候)
急切盼复,谢谢

#3


不一定会快,现在的编译器优化的很好,
另外如果你的 VC 代码优化的很好,用汇编不一定能快。

嵌入,如:
   int p;
   _asm{
        mov P,eax;
        shl p,1;
   }

#4


1秒 --> 100ms, 恐怕要改进算法.

#5


如果想达到1S->100ms,如果你原来的编译器不是VC还好说,不然的话就算在汇编里用MMX指令也比较难达到这种程度。。。我曾经也是这样想用汇编把我的一段处理量较大的代码改成汇编的,结果速度反而没有VC优化的快,不过使用了MMX指令就会快一点了。

#6


在Visual C++中使用内联汇编 

一、内联汇编的优缺点 

   因为在Visual C++中使用内联汇编不需要额外的编译器和联接器,且可以处理Visual C++中不能处理的一些事情,而且可以使用在C/C++中的变量,所以非常方便。内联汇编主要用于如下场合: 

   1.使用汇编语言写函数; 
   2.对速度要求非常高的代码; 
   3.设备驱动程序中直接访问硬件; 
   4."Naked" Call的初始化和结束代码。 
     //(."Naked",理解了意思,但是不知道怎么翻译^_^,大概就是不需要C/C++的编译器(自作聪明)生成的函数初始化和收尾代码,请参看MSDN的"Naked Functions"的说明) 

   内联汇编代码不易于移植,如果你的程序打算在不同类型的机器(比如x86和Alpha)上运行,应当尽量避免使用内联汇编。这时候你可以使用MASM,因为MASM支持更方便的的宏指令和数据指示符。 


二、内联汇编关键字 

   在Visual C++使用内联汇编用到的是__asm关键字,这个关键字有两种使用方法: 

   1.简单__asm块 
       __asm 
       { 
           MOV     AL, 2 
           MOV     DX, 0XD007 
           OUT     AL, DX 
       } 

   2.在每条汇编指令之前加__asm关键字 
       __asm MOV   AL, 2 
       __asm MOV   DX, 0xD007 
       __asm OUT   AL, DX 

   因为__asm关键字是语句分隔符,因此你可以把汇编指令放在同一行: 
       __asm MOV AL, 2     __asm MOV DX, 0XD007    __asm OUT AL, DX 

   显然,第一种方法和C/C++的风格很一致,并且有很多其它优点,因此推荐使用第一种方法。 

   不象在C/C++中的"{}",__asm块的"{}"不会影响C/C++变量的作用范围。同时,__asm块可以嵌套,嵌套也不会影响变量的作用范围。 



三、在__asm块中使用汇编语言 

   1.内联汇编指令集 
   内联汇编完全支持的Intel 486指令集,允许使用MMX指令。不支持的指令可以使用_EMIT伪指令定义(_EMIT伪指令说明见下文)。 

   2.MASM表达式 
   内联汇编可以使用MASM中的表达式。比如: MOV EAX, 1。 

   3.数据指示符和操作符 
   虽然__asm块中允许使用C/C++的数据类型和对象,但它不能用MASM指示符和操作符定义数据对象。这里特别指出,__asm块中不允许MASM中的定义指示符: DB、DW、DD、DQ、DT和DF,也不允许DUP和THIS操作符。MASM结构和记录也不再有效,内联汇编不接受STRUC、RECORD、WIDTH或者MASK。 

   4.EVEN和ALIGN指示符 
   尽管内联汇编不支持大多数MASM指示符,但它支持EVEN和ALIGN,当需要的时候,这些指示符在汇编代码里面加入NOP(空操作)指令使标号对齐到特定边界。这样可以使某些处理器取指令时具有更高的效率。 

   5.MASM宏指示符 
   内联汇编不是宏汇编,不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏操作符(<>、!、&、%和.TYPE)。 

   6.段说明 
   必须使用寄存器来说明段,跨越段必须显式地说明,如ES:[BX]。 

   7.类型和变量大小 
   我们可以使用LENGTH来取得C/C++中的数组中的元素个数,如果不是一个数组,则结果为一。使用SIZE来取得C/C++中变量的大小,一个变量的大小是LENGTH和TYPE的乘积。TYPE用来取得一个变量的大小,如果是一个数组,它得到的一个数组中的单个元素的大小。 

   8.注释 
   可以使用C/C++的注释,但推荐用ASM的注释,即";"号。 

   9._EMIT伪指令 
   _EMIT伪指令相当于MASM中的DB,但一次只能定义一个字节,比如: 
       __asm 
       { 
           JMP     _CodeOfAsm 

           _EMIT   0x00    ; 定义混合在代码段的数据 
           _EMIT   0x01 

       _CodeOfAsm: 
           ; 这里是代码 
           _EMIT   0x90    ; NOP指令 
       } 



四、在__asm块中使用C/C++语言元素 

   C/C++与汇编可以混合使用,在内联汇编可以使用C/C++的变量和很多其它C/C++的元素。在__asm块中可以使用以下C/C++元素: 

   1.符号,包括标号、变量和函数名; 

   2.常量,包括符号常量和枚举型(enum)成员; 

   3.宏定义和预处理指示符; 

   4.注释,包括"/**/"和"//"; 

   5.类型名,包括所有MASM中合法的类型 

   6.typedef名称, 像PTR、TYPE、特定的结构成员或枚举成员这样的通用操作符。 

   在__asm块中,可以使用C/C++或ASM的基数计数法(比如: 0x100和100H是相等的)。 

   __asm块中不能使用像<<一类的C/C++操作符。C/C++和MASM通用的操作符,比如"*"和"[]"操作符,都被认为是汇编语言的操作符。举个例子: 

       int array[10]; 

       __asm MOV array[6], BX ;  Store BX at array+6 (not scaled) 

       array[6] = 0;         /* Store 0 at array+12 (scaled) */ 

   * 小技巧: 内联汇编中,你可以使用TYPE操作符使作其与C一致。比如,下面两条语句是一样的: 

       __asm MOV array[6 * TYPE int], 0 ; Store 0 at array + 12 

       array[6] = 0;                   /* Store 0 at array + 12 */ 

   内联汇编能通过变两名直接引用C/C++的变量。__asm块中可以引用任何符号,包括变量名。 

   如果C/C++中的类、结构或者枚举成员具有唯一的名称,如果在"."操作符之前不指定变量或者typedef名称,则__asm块中只能引用成员名称。然而,如果成员不是唯一的,你必须在"."操作符之前加上变量名或typedef名称。例如,下面的两个结构都具有same_name这个成员变量: 

       struct first_type 
       { 
           char *weasel; 
           int same_name; 
       }; 

       struct second_type 
       { 
           int wonton; 
           long same_name; 
       }; 

   如果按下面声明变量: 

       struct first_type hal; 
       struct second_type oat; 

   那么,所有引用same_name成员的地方都必须使用变量名,因为same_name不是唯一的。另外,上面的weasel变量具有唯一的名称,你可以仅仅使用它的成员名称来引用它: 

       __asm 
       { 
           MOV EBX, OFFSET hal 
           MOV ECX, [EBX]hal.same_name ; 必须使用 'hal' 
           MOV ESI, [EBX].weasel       ; 可以省略 'hal' 
       } 

   注意,省略了变量名仅仅是为了写代码的方便,生成的汇编指令的还是一样的。 

   可以不受限制地访问C++成员变量,但是不能调用C++的成员函数。 



五、寄存器使用 

   一般来说,在__asm块开始的时候,寄存器是空的,不能在两个__asm之间保存寄存器的值。(这是MSDN上说的,我在实际使用时发现,好像并不是这样。不过它是说"一般",我是特殊:)) 

   如果一个函数被声明成了__fastcall,则其参数将放在寄存器中,这将给寄存器的管理带来问题。所以,如果要将一个函数声明成__fastcall,必须保存ECX寄存器。为了避免以上的冲突,在声明为__fastcall的函数中不要有__asm块。如果用了/Gr编译选项(它全局的变成__fastcall),将每个函数声明成__cdecl或者__stdcall,这个属性告诉编译器用传统的C方法。 

   如果使用EAX、EBX、ECX、EDX、ESI和EDI寄存器,你不需要保存它;但如果你用到了DS、 SS、SP、BP和标志寄存器,那就应该PUSH保存这些寄存器。 

   如果程序中改变了用于STD和CLD的方向标志,你必须将其恢复到原来的值。 




六、转跳 

   可以在C里面使用goto调到__asm块中的标号处,也可以在__asm块中转跳到__asm块里面和外面的标号处。__asm块内的标号是不区分大小写的(指令、指示符等也是不区分大小写的)。例: 

       void func() 
       { 
               goto C_Dest;    /* 合法 */ 
               goto c_dest;    /* 错误 */ 

               goto A_Dest;    /* 合法 */ 
               goto a_dest;    /* 合法 */ 

               __asm 
               { 
                       JMP C_Dest  ; 合法 
                       JMP c_dest  ; MSDN上说合法,但是我在VS.NET中编译,认为这样不合法 

                       JMP A_Dest  ; 合法 
                       JMP a_dest  ; 合法 

       a_dest:     ; __asm 标号 
               } 

       C_Dest:     /* C的标号 */ 
       return; 
       } 


   不要使用函数名称当作标号,否则将使其跳到函数执行而不是标号处。如下所示: 

       ; 错误: 使用函数名作为标号 
       JNE exit 
       . 
       . 
       . 
       exit: 
       ; 下面是更多的ASM代码 


   美元符号$用于指定当前位置,如下所用,常用于条件跳转: 

       JNE $+5 ; 下面这条指令的长度是5个字节 
       JMP farlabel 
       ;$+5,跳到了这里 
       . 
       . 
       . 
       farlabel: 



七、调用函数 

   内联汇编调用C/C++函数必须自己清除堆栈,下面是一个调用C/C++函数例子: 

       #include <stdio.h> 

       char szformat[] = "%s %s\n"; 
       char szHello[] = "Hello"; 
       char szWorld[] = " world"; 
       void main() 
       { 
           __asm 
           { 
               MOV     EAX, OFFSET szWorld 
               PUSH    EAX 
               MOV     EAX, OFFSET szHello 
               PUSH    EAX 
               MOV     EAX, OFFSET szformat 
               PUSH    EAX 
               CALL    printf 

               //内联汇编调用C函数必须自己清除堆栈 
               //用不使用的EBX寄存器清除堆栈,或ADD ESP, 12 
               POP     EBX 
               POP     EBX 
               POP     EBX 
           } 
       } 

   注意:函数参数是从右向左压栈。 

#7


八、一个例子 

   下面的例子是在VS.NET(即VC7)中C语言写的。先建一个工程,将下列代码放到工程中的.c文件中编译,无需作特别的设置,即可编译通过。 

   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //预处理 
   #include <Windows.h> 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 


   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //全局变量 
   HWND g_hWnd; 
   HINSTANCE g_hInst; 

   TCHAR szTemp[1024]; 

   TCHAR szAppName[] = "CRC32 Sample"; 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 


   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //函数声明 
   DWORD GetCRC32(const BYTE *pbData, int nSize); 
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow); 
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam); 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 




   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //主函数 
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow) 
   { 
       MSG msg; 
       WNDCLASSEX wndClassEx; 

       g_hInst = hInstance; 

       wndClassEx.cbSize = sizeof(WNDCLASSEX); 
       wndClassEx.style = CS_VREDRAW | CS_HREDRAW; 
       wndClassEx.lpfnWndProc = (WNDPROC) WindowProc; 
       wndClassEx.cbClsExtra = 0; 
       wndClassEx.cbWndExtra = 0; 
       wndClassEx.hInstance = g_hInst; 
       wndClassEx.hIcon = LoadIcon(NULL, IDI_APPLICATION); 
       wndClassEx.hCursor = LoadCursor(NULL, IDC_ARROW); 
       wndClassEx.hbrBackground = (HBRUSH) (COLOR_WINDOW); 
       wndClassEx.lpszMenuName = NULL; 
       wndClassEx.lpszClassName = szAppName; 
       wndClassEx.hIconSm = NULL; 

       RegisterClassEx(&wndClassEx); 

       g_hWnd = CreateWindowEx(0, szAppName, szAppName, WS_OVERLAPPED | WS_CAPTION | WS_SYSMENU | WS_THICKFRAME | WS_MINIMIZEBOX, 
           CW_USEDEFAULT, CW_USEDEFAULT, 300, 70, 
           NULL, NULL, g_hInst, NULL); 

       ShowWindow(g_hWnd, iCmdShow); 
       UpdateWindow(g_hWnd); 

       while (GetMessage(&msg, NULL, 0, 0)) 
       { 
           TranslateMessage(&msg); 
           DispatchMessage(&msg); 
       } 
       return ((int) msg.wParam); 
   } 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 



   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //主窗口回调函数 
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam) 
   { 
       switch (uMsg) 
       { 
       case WM_CREATE: 
           CreateWindowEx(WS_EX_CLIENTEDGE, "EDIT", NULL, WS_CHILD | WS_VISIBLE | WS_BORDER | ES_AUTOHSCROLL | ES_AUTOVSCROLL | ES_NOHIDESEL | WS_OVERLAPPED, 
               7, 12, 220, 22, 
               hWnd, (HMENU)1000, g_hInst, NULL); 
           CreateWindowEx(0, "BUTTON", "&OK", WS_CHILD | WS_VISIBLE | BS_PUSHBUTTON | WS_OVERLAPPED | BS_FLAT, 
               244, 12, 40, 20, 
               hWnd, (HMENU)IDOK, g_hInst, NULL); 

           break; 

       case WM_COMMAND: 
           switch (LOWORD(wParam)) 
           { 
           case IDOK: 
               GetDlgItemText(g_hWnd, 1000, szTemp + 100, 800); 
               wsprintf(szTemp, "当前文本框内的字符串的CRC32校验码是: 0x%lX", GetCRC32(szTemp + 100, (int)strlen(szTemp + 100))); 
               MessageBox(g_hWnd, szTemp, szAppName, MB_OK|MB_ICONINformATION); 
           } 
           break; 

       case WM_DESTROY: 
           PostQuitMessage(0); 
           break; 

       default: 
           return (DefWindowProc(hWnd, uMsg, wParam, lParam)); 
       } 
       return (0); 
   } 
   //////////////////////////////////////////////////////////////////////////////////////////////////// 




   //////////////////////////////////////////////////////////////////////////////////////////////////// 
   //GetCRC32: 求字节流的CRC32校验码 
   //参数: 
   //      pbData: 指向字节流缓冲区首地址 
   //      nSize: 字节流长度 
   // 
   //返回值: 
   //      字节流的CRC32校验码 
   // 
   //这里使用查表法求CRC32校验码,这部分是参考老罗的文章《 矛与盾的较量(2)——CRC原理篇》该写的。 
   //原文的具体内容请参看: http://asp.7i24.com/netcool/laoluo/articles/show_article.asp?Article_ID=15 
   // 
   //下面使用内联汇编求CRC32校验码,充分使用了CPU中的寄存器,速度和方便性都是使用C/C++所不能比拟的 
   // 
   DWORD GetCRC32(const BYTE *pbData, int nSize) 
   { 
       DWORD dwCRC32Table[256]; 

       __asm   //这片内联汇编是初始化CRC32表 
       { 
           MOV     ECX, 256 

   _NextTable: 
           LEA     EAX, [ECX-1] 
           PUSH    ECX 
           MOV     ECX, 8 

   _NextBit: 
           SHR     EAX, 1 
           JNC     _NotCarry 
           XOR     EAX, 0xEDB88320 
   _NotCarry: 
           DEC     ECX 
           JNZ     _NextBit 

           POP     ECX 
           MOV     [dwCRC32Table + ECX*4 - 4], EAX 
           DEC     ECX 
           JNZ     _NextTable 
       } 

       __asm   //下面是求CRC32校验码 
       { 
           MOV     EAX, -1 
           MOV     EBX, pbData 
           OR      EBX, EBX 
           JZ      _Done 
           MOV     ECX, nSize 
           OR      ECX, ECX 
           JZ      _Done 

   _NextByte: 
           MOV     DL, [EBX] 

           XOR     DL, AL 
           MOVZX   EDX, DL 
           SHR     EAX, 8 
           XOR     EAX, [dwCRC32Table + EDX*4] 

           INC     EBX 
           LOOP    _NextByte 
   _Done: 
           NOT     EAX 
       } 
   } 
   ////////////////////////////////////////////////////////////////////////////////////////////////////

#8


从算法入手吧,想靠汇编提高一个数量级,那得汇编大牛才可能超越vc优化代码

#9


忘了,还与机器相关的

#10


我觉得如果仅对内存中的数据进行处理,用汇编更快些。

如果对外存中的文件进行处理,当汇编程序中不设置磁盘缓冲区时速度比不上C。
(我有的是MASM 和 TURBO C 2。0),可能是TC的编译程序自动设置了磁盘缓冲区。

也得看你用的汇编程序和编译程序。