在学习C语言的时候知道了动态内存分配的概念,也知道了malloc()的使用方式,但是一直没有去了解或者认真学习malloc()的实现原理。今天看到关于动态内存分配方面的资料,就整理总结下。
在C语言中只能通过malloc()和其派生的函数进行动态的申请内存,而实现的根本是通过系统调用实现的(在linux下是通过sbrk()系统调用实现),这次的总结也是基于linux系统。
在说明malloc()的实现思路之前先要说下在linux系统下是怎么程序中的堆的。在linux系统下面一个程序的堆的管理是通过内存块进行管理的,也就是将堆分成了很多大小不一的内存块。这些块怎么管理尼,比如怎么查询块的大小,怎么查询块是否正在被程序使用,怎么知道这个块的地址。为了解决内存块的管理所以要设计一个管理内存块的数据结构,详细的数据结构如下:
/**内存控制块数据结构,用于管理所有的内存块
* is_available: 标志着该块是否可用。1表示可用,0表示不可用
* size: 该块的大小
**/
struct mem_control_block {
int is_available;
int size;
};
有了管理内存块的数据结构,那么在内存中堆的组织形式也好理解了,也就是堆是由很多内存块组成的,所以有了如下的示意图:综合上面的知识,可以很容易想到malloc()实现的大体思路。首先挨个检查堆中的内存是否可用,如果可用那么大小是否能满足需求,要是都满足的话就直接用。当遍历了堆中的所有内存块时,要是没有能满足需求的块时就只能通过系统调用向操作系统申请新的内存,然后将新的内存添加到堆中。思路很简单,malloc()实现流程图如下所示:
看完上面的思路,也会很容易的想到free()函数的实现思路,只要将内存管理块设置为可用就可以了。这样下次调用malloc()函数的时候就可以将该内存块作为可分配块再次进行分配了。
最后,贴上malloc()和free()实现的代码:
malloc()实现:
/**内存控制块数据结构,用于管理所有的内存块
* is_available: 标志着该块是否可用。1表示可用,0表示不可用
* size: 该块的大小
**/
struct mem_control_block {
int is_available;
int size;
};
/**在实现malloc时要用到linux下的全局变量
*managed_memory_start:该指针指向进程的堆底,也就是堆中的第一个内存块
*last_valid_address:该指针指向进程的堆顶,也就是堆中最后一个内存块的末地址
**/
void *managed_memory_start;
void *last_valid_address;
/**malloc()功能是动态的分配一块满足参数要求的内存块
*numbytes:该参数表明要申请多大的内存空间
*返回值:函数执行结束后将返回满足参数要求的内存块首地址,要是没有分配成功则返回NULL
**/
void *malloc(size_t numbytes) {
//游标,指向当前的内存块
void *current_location;
//保存当前内存块的内存控制结构
struct mem_control_block *current_location_mcb;
//保存满足条件的内存块的地址用于函数返回
void *memory_location;
memory_location = NULL;
//计算内存块的实际大小,也就是函数参数指定的大小+内存控制块的大小
numbytes = numbytes + sizeof(struct mem_control_block);
//利用全局变量得到堆中的第一个内存块的地址
current_location = managed_memory_start;
//对堆中的内存块进行遍历,找合适的内存块
while (current_location != last_valid_address) //检查是否遍历到堆顶了
{
//取得当前内存块的内存控制结构
current_location_mcb = (struct mem_control_block*)current_location;
//判断该块是否可用
if (current_location_mcb->is_available)
//检查该块大小是否满足
if (current_location_mcb->size >= numbytes)
{
//满足的块将其标志为不可用
current_location_mcb->is_available = 0;
//得到该块的地址,结束遍历
memory_location = current_location;
break;
}
//取得下一个内存块
current_location = current_location + current_location_mcb->size;
}
//在堆中已有的内存块中没有找到满足条件的内存块时执行下面的函数
if (!memory_location)
{
//向操作系统申请新的内存块
if (sbrk(numbytes) == -1)
return NULL;//申请失败,说明系统没有可用内存
memory_location = last_valid_address;
last_valid_address = last_valid_address + numbytes;
current_location_mcb = (struct mem_control_block)memory_location;
current_location_mcb->is_available = 0;
current_location_mcb->size = numbytes;
}
//到此已经得到所要的内存块,现在要做的是越过内存控制块返回内存块的首地址
memory_location = memory_location + sizeof(struct mem_control_block);
return memory_location;
}
free()实现:
/**free()功能是将参数指向的内存块进行释放
*firstbyte:要释放的内存块首地址
*返回值:空
**/
void free(void *firstbyte)
{
struct mem_control_block *mcb;
//取得该块的内存控制块的首地址
mcb = firstbyte - sizeof(struct mem_control_block);
//将该块标志设为可用
mcb->is_available = 1;
return;
}