malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较

时间:2021-12-31 13:11:52

http://www.cppblog.com/woaidongmao/archive/2011/12/02/153160.html

这里比较的VC++编译的C++代码中的性能

我用的是VC6.0测试的

就不介绍这几个的用法了

我写了一段简单的测试代码

测试结果是:

malloc:390
new:391
VirtualAlloc:454
HeapAlloc:47

很明显的是HeapAlloc分配速度最快,malloc次之,new和malloc差不多,VirtualAlloc最慢了(以前小强跟我说这个最快)

我有跟踪了一下

new调用了这段代码

  1. void * __cdecl _nh_malloc (
  2.         size_t nSize,
  3.         int nhFlag
  4.          )
  5. {
  6.         return _nh_malloc_dbg(nSize, nhFlag, _NORMAL_BLOCK, NULL, 0);
  7. }

malloc函数是这样的:

  1. _CRTIMP void * __cdecl malloc (
  2.         size_t nSize
  3.          )
  4. {
  5.         return _nh_malloc_dbg(nSize, _newmode, _NORMAL_BLOCK, NULL, 0);
  6. }

很明显,new和malloc最终调用相同的_nh_malloc_dbg,只是new多了一次函数调用

再继续跟下去,发现最终调用的是return HeapAlloc(_crtheap, 0, size);

基本上真相大白了

VirtualAlloc跟踪不进去,如果说分配的是虚拟内存的话,有可能会慢吧。

回头再认真看看《Windows核心编程》这本书!

欢迎指正!欢迎交流!

测试代码如下:

  1. /******************************************************************
  2. *
  3. * Copyright (c) 2008, xxxx
  4. * All rights reserved.
  5. *
  6. * 文件名称:main.cpp
  7. * 摘    要: 测试申请内存的速度
  8. *
  9. * 当前版本:1.0
  10. * 作     者:吴会然
  11. * 完成日期:2008-11-30
  12. *
  13. * 取代版本:
  14. * 原   作者:
  15. * 完成日期:
  16. *
  17. ******************************************************************/
  18.  
  19. #include <iostream>
  20. #include <windows.h>
  21. using namespace std;
  22.  
  23. int main( int argc, char *argv[] )
  24. {
  25.     int i = 0;
  26.     DWORD dw1 = 0, dw2 = 0, dw3 = 0, dw4 = 0;
  27.     DWORD dwStart = 0;
  28.     DWORD dwEnd = 0;
  29.     for( int j = 0; j < 10; j++ )
  30.      {
  31.          dwStart = ::GetTickCount();
  32.         for( i = 0; i < 20000; i++ )
  33.          {
  34.             char *pDest1 = (char *)malloc(4096);
  35.              free( pDest1 );
  36.     
  37.          }
  38.          dwEnd = ::GetTickCount();
  39.          cout << "malloc 10000次4096大小的内存块,耗时" << dwEnd - dwStart << endl;
  40.          dw1 += dwEnd - dwStart;
  41.  
  42.          dwStart = ::GetTickCount();
  43.         for( i = 0; i < 20000; i++ )
  44.          {
  45.             char *pDest2 = new char[4096];
  46.             delete pDest2;
  47.     
  48.          }
  49.          dwEnd = ::GetTickCount();
  50.          cout << "new 10000次4096大小的内存块,耗时" << dwEnd - dwStart << endl;
  51.          dw2 += dwEnd - dwStart;
  52.  
  53.          dwStart = ::GetTickCount();
  54.         for( i = 0; i < 20000; i++ )
  55.          {
  56.             void* pMem = ::VirtualAlloc(NULL, 4096,   MEM_RESERVE | MEM_COMMIT, PAGE_READWRITE );
  57.              ::VirtualFree(pMem, 0, MEM_RELEASE);
  58.          }
  59.          dwEnd = ::GetTickCount();
  60.          cout << "VirtualAlloc 10000次4096大小的内存块,耗时" << dwEnd - dwStart << endl;
  61.          dw3 += dwEnd - dwStart;
  62.  
  63.         HANDLE hHeap = ::HeapCreate(HEAP_NO_SERIALIZE, 0, 0);
  64.          dwStart = ::GetTickCount();
  65.         for( i = 0; i < 20000; i++ )
  66.          {
  67.             void* pMem2 = ::HeapAlloc(hHeap, HEAP_NO_SERIALIZE, 4096 );
  68.              ::HeapFree(hHeap, HEAP_NO_SERIALIZE, pMem2);
  69.  
  70.          }
  71.          dwEnd = ::GetTickCount();
  72.          cout << "HeapAlloc 10000次4096大小的内存块,耗时" << dwEnd - dwStart << endl;
  73.          dw4 += dwEnd - dwStart;
  74.  
  75.      }
  76.  
  77.      cout << "malloc:" << dw1 << endl;
  78.      cout << "new:" << dw2 << endl;   
  79.      cout << "VirtualAlloc:" << dw3 << endl;   
  80.      cout << "HeapAlloc:" << dw4

====================================

转】李玮剑 评论
1 把分配的内存空间改为4M甚至更高(循环次数减少)试试,结果截然不同。处理M级的大文件时,用VirtualAlloc效率高

2 博主的测试需要考究,系统在创建线程时就已经预先在线程的堆栈段中提交了两个页面。 按照我的观点new和malloc只要消耗的内存没有超过页面大小就不会实际的进行存储器的保留与提交。二者的操作不在一个层面上。

3 在分配大于一个页面数据的时候 virtualAlloc才有意义

4 virtualAlloc是操作系统提供的最根本的内存分配接口。HeapAlloc预先使用virtualAlloc申请了大块的内存,并根据优化算法组织了用于内存管理的数据结构,主要是对小内存分配的优化 new和malloc是语言层面接口,由于HeapAlloc已经有了优化,所以vc中的malloc并没有使用更多的优化算法,直接转入 HeapAlloc。

posted on 2011-08-12 10:59 肥仔 阅读(550)评论(7)  编辑 收藏 引用 所属分类: Windows开发

malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较

评论

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较  回复  更多评论  

楼主我执行你的代码的结果是:
malloc 1840
new 1842
VirtualAlloc 311
HeapAlloc 1608
根本和你的不一样啊
是 VS2008 + win7的执行结果, 内存2G
2011-08-12 20:55 | Cunch

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较  回复  更多评论  

楼主的是错的 你在实际打印看看
2011-08-19 15:27 | asf

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较[未登录]  回复  更多评论  

如果我没有记错的话VirtualAlloc只能正页的分内存,在Win32上每页是4096字节,它是虚拟内存管理器对外的API。

其实像malloc,new ...这样的速度就不要拿出来晒了,慢还不说,多CPU场合并行时速度大大下降,因为普通的并发控制机制成为瓶颈。如果一定非要在单线程分配内存比速度,单块内存256KB以下时(大块没有优化),DLMalloc会轻松灭掉各种malloc,不论什么系统。

如果CPU个数超过8个,并行分配内存,jemalloc和Hoard可能是霸主,操作系统的API做的再好也得俯首称臣。jemalloc和Hoard谁快谁慢,我不清楚,相信相差无几。如果CPU个数6个以下,并行分配,ptmalloc3加速比也不错,且overhead很小。谷歌的CMalloc听说也不错,且能回收垃圾内存,只不过启动速度慢死,跟启动Java虚拟机绝对有一拼!
2011-08-19 22:08 | Chipset

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较[未登录]  回复  更多评论  

我的结果与以上两位趋势都不同。
malloc:47
new:63
VirtualAlloc:404
HeapAlloc:79

Win7中文版64位系统,g++4.6.1编译器64位(-O3),CPU AMD X4 910e, 2.6GHz,内存单条4GB DDR3 1333
2011-08-19 22:48 | Chipset

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较[未登录]  回复  更多评论  

数据量相同情况下,测试了一下DLMalloc版本2.8.5,结果为:
DLMAlloc:16

可见DLMalloc还是比较快的。

数据量加大10倍,相对误差能小一点,但趋势不变。

malloc:332
new:551
VirtualAlloc:3124
HeapAlloc:845
DLMalloc:62
2011-08-19 23:10 | Chipset

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较  回复  更多评论  

非常不错的文章
2011-12-02 20:53 | 美利坚

#re: malloc,new,VirtualAlloc,HeapAlloc性能(速度)比较 回复  更多评论  

我的执行结果比较诡异:
第一遍
malloc:172
new:170
VirtualAlloc:220
HeapAlloc:61
第二遍
malloc:157
new:173
VirtualAlloc:203
HeapAlloc:32
第三遍
malloc:217
new:158
VirtualAlloc:201
HeapAlloc:0
第四遍
malloc:203
new:206
VirtualAlloc:217
HeapAlloc:30
我的配置是vs2008+win7 x64,6g
2012-01-01 17:37 | swordzj