以下转载自安富莱电子: http://forum.armfly.com/forum.php
本章节为大家讲解 FreeRTOS 动态内存管理,动态内存管理是 FreeRTOS 非常重要的一项功能,前面
章节讲解的任务创建、 信号量、 消息队列、 事件标志组、 互斥信号量、 软件定时器组等需要的 RAM 空间
都是通过动态内存管理从 FreeRTOSConfig.h 文件定义的 heap 空间中申请的。
动态内存管理介绍
FreeRTOS 支持 5 种动态内存管理方案,分别通过文件 heap_1,heap_2,heap_3,heap_4 和 heap_5
实现,这 5 个文件在 FreeRTOS 软件包中的路径是:FreeRTOS\Source\portable\MemMang。 用户创
建的 FreeRTOS 工程项目仅需要 5 种方式中的一种。
下面将这 5 种动态内存管理方式分别进行讲解。
动态内存管理方式一 heap_1
heap_1 动态内存管理方式是五种动态内存管理方式中最简单的,这种方式的动态内存管理一旦申请
了相应内存后,是不允许被释放的。 尽管如此,这种方式的动态内存管理还是满足大部分嵌入式应用的,
因为这种嵌入式应用在系统启动阶段就完成了任务创建、 事件标志组、 信号量、 消息队列等资源的创建,
而且这些资源是整个嵌入式应用过程中一直要使用的,所以也就不需要删除,即释放内存。 FreeRTOS 的
动态内存大小在 FreeRTOSConfig.h 文件中进行了定义:
#define configTOTAL_HEAP_SIZE ( ( size_t ) ( 17 * 1024 ) ) //单位字节
用户通过函数 xPortGetFreeHeapSize 就能获得 FreeRTOS 动态内存的剩余,进而可以根据剩余情况优化
动态内存的大小。 heap_1 方式的动态内存管理有以下特点:
项目应用不需要删除任务、 信号量、 消息队列等已经创建的资源。
具有时间确定性,即申请动态内存的时间是固定的并且不会产生内存碎片。
确切的说这是一种静态内存分配,因为申请的内存是不允许被释放掉的。
动态内存管理方式二 heap_2
与 heap_1 动态内存管理方式不同,heap_2 动态内存管理利用了最适应算法,并且支持内存释放。
但是 heap_2 不支持内存碎片整理,动态内存管理方式四 heap_4 支持内存碎片整理。 FreeRTOS 的动态
内存大小在 FreeRTOSConfig.h 文件中进行了定义:
#define configTOTAL_HEAP_SIZE ( ( size_t ) ( 17 * 1024 ) ) //单位字节
用户通过函数 xPortGetFreeHeapSize 就能获得 FreeRTOS 动态内存的剩余,但是不提供动态内存是
如何被分配成各个小内存块的信息。 另外,就是用户可以根据剩余情况优化动态内存的大小。 heap_2 方
式的动态内存管理有以下特点:
不考虑内存碎片的情况下,这种方式支持重复的任务、 信号量、 事件标志组、 软件定时器等内部资源
的创建和删除。
如果用户申请和释放的动态内存大小是随机的,不建议采用这种动态内存管理方式,比如:
项目应用中需要重复的创建和删除任务,如果每次创建需要动态内存大小相同,那么 heap_2 比
较适合,但每次创建需要动态内存大小不同,那么方式 heap_2 就不合适了,因为容易产生内存
碎片,内存碎片过多的话会导致无法申请出一个大的内存块出来,这种情况使用 heap_4 比较合
适。
项目应用中需要重复的创建和删除消息队列,也会出现类似上面的情况,这种情况下使用 heap_4
比较合适。
直接的调用函数 pvPortMalloc() 和 vPortFree()也容易出现内存碎片。 如果用户按一定顺序成
对的申请和释放,基本没有内存碎片的,而不按顺序的随机申请和释放容易产生内存碎片。
如果用户随机的创建和删除任务、 消息队列、 事件标志组、 信号量等内部资源也容易出现内存碎片。
heap_2 方式实现的动态内存申请不具有时间确定性,但是比 C 库中的 malloc 函数效率要高。
大部分需要动态内存申请和释放的小型实时系统项目可以使用 heap_2。 如果需要内存碎片的回收机
制可以使用 heap_4。
动态内存管理方式三 heap_3
这种方式实现的动态内存管理是对编译器提供的 malloc 和 free 函数进行了封装,保证是线程安全的。
heap_3 方式的动态内存管理有以下特点:
需要编译器提供 malloc 和 free 函数。
不具有时间确定性,即申请动态内存的时间不是固定的。
增加 RTOS 内核的代码量。
另外要特别注意一点,这种方式的动态内存申请和释放不是用的 FreeRTOSConfig.h 文件中定义的
heap空间大小,而是用的编译器设置的heap空间大小或者说STM32启动代码中设置的heap空间大小,
比如 MDK 版本的 STM32F103 工程中 heap 大小就是在这里进行的定义:
动态内存管理方式四 heap_4
与 heap_2 动态内存管理方式不同,heap_4 动态内存管理利用了最适应算法,且支持内存碎片的回
收并将其整理为一个大的内存块。 FreeRTOS 的动态内存大小在 FreeRTOSConfig.h 文件中进行了定义:
#define configTOTAL_HEAP_SIZE ( ( size_t ) ( 17 * 1024 ) ) //单位字节
heap_4 同时支持将动态内存设置在指定的 RAM 空间位置。
用户通过函数 xPortGetFreeHeapSize 就能获得 FreeRTOS 动态内存的剩余,但是不提供动态内存是
如何被分配成各个小内存块的信息。 使用函数 xPortGetMinimumEverFreeHeapSize 能够获取从系统启
动到当前时刻的动态内存最小剩余,从而用户就可以根据剩余情况优化动态内存的大小。 heap_4 方式的
动态内存管理有以下特点:
可以用于需要重复的创建和删任务、 信号量、 事件标志组、 软件定时器等内部资源的场合。
随机的调用 pvPortMalloc() 和 vPortFree(),且每次申请的大小都不同,也不会像 heap_2 那样产
生很多的内存碎片。
不具有时间确定性,即申请动态内存的时间不是确定的,但是比 C 库中的 malloc 函数要高效。
heap_4 比较实用,本教程配套的所有例子都是用的这种方式的动态内存管理,用户的代码也可以直
接调用函数 pvPortMalloc() 和 vPortFree()进行动态内存的申请和释放。
动态内存管理方式五 heap_5
有时候我们希望 FreeRTOSConfig.h 文件中定义的 heap 空间可以采用不连续的内存区,比如我们希
望可以将其定义在内部 SRAM 一部分,外部 SRAM 一部分,此时我们就可以采用 heap_5 动态内存管理
方式。另外,heap_5 动态内存管理是在 heap_4 的基础上实现的。
heap_5 动态内存管理是通过函数 vPortDefineHeapRegions 进行初始化的,也就是说用户在创建任
务 FreeRTOS 的内部资源前要优先级调用这个函数 vPortDefineHeapRegions,否则是无法通过函数
pvPortMalloc 申请到动态内存的。
函数 vPortDefineHeapRegions 定义不同段的内存空间采用了下面这种结构体:
定义的时候要注意两个问题,一个是内存段结束时要定义 NULL。另一个是内存段的地址是从低地址到高
地址排列。
用户通过函数 xPortGetFreeHeapSize 就能获得 FreeRTOS 动态内存的剩余,但是不提供动态内存是
如何被分配成各个小内存块的信息。 使用函数 xPortGetMinimumEverFreeHeapSize 能够获取从系统启
动到当前时刻的动态内存最小剩余,从而用户就可以根据剩余情况优化动态内存的大小。
五种动态内存方式总结
五种动态内存管理方式简单总结如下,实际项目中,用户根据需要选择合适的:
heap_1:五种方式里面最简单的,但是申请的内存不允许释放。
heap_2:支持动态内存的申请和释放,但是不支持内存碎片的处理,并将其合并成一个大的内存块。
heap_3:将编译器自带的 malloc 和 free 函数进行简单的封装,以支持线程安全,即支持多任务调
用。
heap_4:支持动态内存的申请和释放,支持内存碎片处理,支持将动态内存设置在个固定的地址。
heap_5:在 heap_4 的基础上支持将动态内存设置在不连续的区域上。
动态内存和静态内存比较
静态内存方式是从 FreeRTOS 的 V9.0.0 版本才开始有的,而我们本次教程使用的版本是 V8.2.3。所
以静态内存方式我们暂时不做讲解,等 FreeRTOS 教程版本升级时再做讲解。 关于静态内存方式和动态内
存方式的优缺点可以看官方的此贴说明:点击查看
(制作此教程的时候,官方的 FreeRTOS V9.0.0 正式版本还没有发布,所以采用的是当前最新的 V8.2.3)
动态内存 API 函数
动态内存的 API 函数在官方的在线版手册上面没有列出,其实使用也比较简单,类似 C 库的 malloc
和 free 函数,具体使用参看下面的实例说明。
实验练兵场:
声明一个结构类型:
typedef struct Msg
{
uint8_t ucMessageID;
uint16_t usData[];
uint32_t ulData[];
}MSG_T;
消息队列发送任务:
static void vTaskWork(void *pvParameters)
{
MSG_T *ptMsg;
uint8_t ucCount = ; while()
{
if (key1_flag==)
{
key1_flag=; }
/* K2键按下,向xQueue1发送数据 */
if(key2_flag==)
{
key2_flag=;
printf("=================================================\r\n");
printf("当前动态内存大小 = %d\r\n", xPortGetFreeHeapSize());
ptMsg = (MSG_T *)pvPortMalloc(sizeof(MSG_T));
// ptMsg = (MSG_T *)pvPortMalloc(32);
printf("申请动态内存后剩余大小 = %d\r\n", xPortGetFreeHeapSize()); ptMsg->ucMessageID = ucCount++;
ptMsg->ulData[] = ucCount++;
ptMsg->usData[] = ucCount++; /* 使用消息队列实现指针变量的传递 */
if(xQueueSend(xQueue1, /* 消息队列句柄 */
(void *) &ptMsg, /* 发送结构体指针变量ptMsg的地址 */
(TickType_t)) != pdPASS )
{
/* 发送失败,即使等待了10个时钟节拍 */
printf("K2键按下,向xQueue2发送数据失败,即使等待了10个时钟节拍\r\n");
vPortFree(ptMsg);
printf("释放申请的动态内存后大小 = %d\r\n", xPortGetFreeHeapSize());
}
else
{
/* 发送成功 */
printf("K2键按下,向xQueue2发送数据成功\r\n");
/* 由于是低优先级任务向高优先级任务发送消息队列,如果成功的话说明高优先级任务已经执行。
并获得了消息队列中的数据,所以我们可以在此处释放动态内存,不会出现高优先级任务还没有
获得消息队列数据,我们就将动态内存释放掉了。
*/
vPortFree(ptMsg);
printf("释放申请的动态内存后大小 = %d\r\n", xPortGetFreeHeapSize());
}
// TIM_Mode_Config(); } vTaskDelay();
}
}
接收任务:
void vTaskBeep(void *pvParameters)
{
MSG_T *ptMsg;
BaseType_t xResult;
const TickType_t xMaxBlockTime = pdMS_TO_TICKS(); /* 设置最大等待时间为500ms */ while()
{
xResult = xQueueReceive(xQueue1, /* 消息队列句柄 */
(void *)&ptMsg, /* 这里获取的是结构体的地址 */
(TickType_t)xMaxBlockTime);/* 设置阻塞时间 */ if(xResult == pdPASS)
{
/* 成功接收,并通过串口将数据打印出来 */
printf("接收到消息队列数据ptMsg->ucMessageID = %d\r\n", ptMsg->ucMessageID);
printf("接收到消息队列数据ptMsg->ulData[0] = %d\r\n", ptMsg->ulData[]);
printf("接收到消息队列数据ptMsg->usData[0] = %d\r\n", ptMsg->usData[]);
}
else
{
/* 超时 */
BEEP_TOGGLE;
}
}
}
实验现象展示:
那么问题就来了:
typedef struct Msg
{
uint8_t ucMessageID;
uint16_t usData[2];
uint32_t ulData[2];
}MSG_T;
这个结构体类型无论是在4字节对齐还是8字节对齐的编译器上,输出都是16字节。keil默认4字节对齐。
申请之前,显示:当前动态内存大小 =
申请之后,显示:申请动态内存后剩余大小 =
奇怪了,怎么会减少了24个字节呢?明明只申请了16字节啊。
heap_4文件也就是我们所有实验使用的堆内存文件,它使用一个链表结构来跟踪记录空闲内存块。结构体定义为:
typedef struct A_BLOCK_LINK
{
struct A_BLOCK_LINK *pxNextFreeBlock; /*指向列表中下一个空闲块*/
size_t xBlockSize; /*当前空闲块的大小,包括链表结构大小*/
} BlockLink_t;
与第二种内存管理策略一样,空闲内存块也是以单链表的形式组织起来的,BlockLink_t类型的局部静态变量xStart表示链表头,但第四种内存管理策略的链表尾保存在内存堆空间最后位置,并使用BlockLink_t指针类型局部静态变量pxEnd指向这个区域(第二种内存管理策略使用静态变量xEnd表示链表尾),如下图所示。
第四种内存管理策略和第二种内存管理策略还有一个很大的不同是:第四种内存管理策略的空闲块链表不是以内存块大小为存储顺序,而是以内存块起始地址大小为存储顺序,地址小的在前,地址大的在后。这也是为了适应合并算法而作的改变。
整个有效空间组成唯一一个空闲块,在空闲块的起始位置放置了一个链表结构,用于存储这个空闲块的大小和下一个空闲块的地址。由于目前只有一个空闲块,所以空闲块的pxNextFreeBlock指向指针pxEnd指向的位置,而链表xStart结构的pxNextFreeBlock指向空闲块。xStart表示链表头,pxEnd指向位置表示链表尾。
当申请x字节内存时,实际上不仅需要分配x字节内存,还要分配一个BlockLink_t类型结构体空间,用于描述这个内存块,结构体空间位于空闲内存块的最开始处。当然,申请的内存大小和BlockLink_t类型结构体大小都要向上扩大到对齐字节数的整数倍。
这个扩展怎么理解呢?我们的keil默认是4字节对齐的,那么内存地址开始处,其值一定要能被4整除,例如一个地址现在是0x01,那么我们存放一个int四字节的变量,并不能从地址0x01处开始,而必须地址扩展到0x04,这样才可以整除4.这个在C语言中已经做过分析。有了这个之后,我们看源码知道,还需要把BlockLink_t类型的结构放在我们申请的内存开始处,这就证明了,我们的消耗的堆内存,是等于字节对齐要求之后,BlockLink_t类型结构占用的字节 + 申请的字节数。
BlockLink_t类型结构的元素,第一个是个指针,在keil编译器中,一个指针4个字节,第二个是个size_t类型的元素,siez_t在我们使用的环境下,是unsigned int的别名,也是占用4个字节,这样,相当于我们实际消耗的堆内存,是申请的内存经过字节对齐之后,再加上8个字节的大小的。
现在举例说明:
现在我把申请ptMsg = (MSG_T *)pvPortMalloc(sizeof(MSG_T));换成:
ptMsg = (MSG_T *)pvPortMalloc(30);
输出如下:
不是说申请内存加8字节码?这里为什么还差2字节,申请前23480,申请后23440.注意,我前面说的是内存对齐之后,再加上8字节,我申请30字节的内存,会被扩展成32字节,这样才能满足四字节对齐的要求。
我们再测试,把申请的内存换成ptMsg = (MSG_T *)pvPortMalloc(32);这样的输出,必然和上面一样: