kzalloc 函数详解(转载)

时间:2022-09-07 15:00:11

用kzalloc申请内存的时候, 效果等同于先是用 kmalloc() 申请空间 , 然后用 memset() 来初始化 ,所有申请的元素都被初始化为 0.

  1. /**
  2. * kzalloc - allocate memory. The memory is set to zero.
  3. * @size: how many bytes of memory are required.
  4. * @flags: the type of memory to allocate (see kmalloc).
  5. */
  6. static inline void *kzalloc(size_t size, gfp_t flags)
  7. {
  8. return kmalloc(size, flags | __GFP_ZERO);
  9. }

kzalloc 函数是带参数调用kmalloc函数,添加的参数是或了标志位__GFP_ZERO,

  1. void *__kmalloc(size_t size, gfp_t flags)
  2. {
  3. struct kmem_cache *s;
  4. void *ret;
  5. if (unlikely(size > SLUB_MAX_SIZE))
  6. return kmalloc_large(size, flags);
  7. s = get_slab(size, flags);
  8. if (unlikely(ZERO_OR_NULL_PTR(s)))
  9. return s;
  10. ret = slab_alloc(s, flags, -1, _RET_IP_);
  11. trace_kmalloc(_RET_IP_, ret, size, s->size, flags);
  12. return ret;
  13. }

这个函数调用trace_kmalloc,flags参数不变,继续往里面可以看到

  1. static __always_inline void *slab_alloc(struct kmem_cache *s,
  2. gfp_t gfpflags, int node, unsigned long addr)
  3. {
  4. void **object;
  5. struct kmem_cache_cpu *c;
  6. unsigned long flags;
  7. unsigned int objsize;
  8. gfpflags &= gfp_allowed_mask;
  9. lockdep_trace_alloc(gfpflags);
  10. might_sleep_if(gfpflags & __GFP_WAIT);
  11. if (should_failslab(s->objsize, gfpflags))
  12. return NULL;
  13. local_irq_save(flags);
  14. c = get_cpu_slab(s, smp_processor_id());
  15. objsize = c->objsize;
  16. if (unlikely(!c->freelist || !node_match(c, node)))
  17. object = __slab_alloc(s, gfpflags, node, addr, c);
  18. else {
  19. object = c->freelist;
  20. c->freelist = object[c->offset];
  21. stat(c, ALLOC_FASTPATH);
  22. }
  23. local_irq_restore(flags);
  24. if (unlikely((gfpflags & __GFP_ZERO) && object))
  25. memset(object, 0, objsize);
  26. kmemcheck_slab_alloc(s, gfpflags, object, c->objsize);
  27. kmemleak_alloc_recursive(object, objsize, 1, s->flags, gfpflags);
  28. return object;
  29. }

这里主要判断两个标志,WAIT和ZERO,和本文有关的关键代码就是

if
(unlikely((gfpflags & __GFP_ZERO) && object))
memset(object, 0, objsize);

到此,这个函数区别于kmalloc的地方就清楚了

kmalloc
函数详解

#include <linux/slab.h> void *kmalloc(size_t size, int flags);

给 kmalloc 的第一个参数是要分配的块的大小. 第 2 个参数, 分配标志, 非常有趣, 因为它以几个方式控制 kmalloc 的行为.
最一般使用的标志, GFP_KERNEL, 意思是这个分配((内部最终通过调用 __get_free_pages 来进行, 它是 GFP_
前缀的来源) 代表运行在内核空间的进程而进行的. 换句话说, 这意味着调用函数是代表一个进程在执行一个系统调用. 使用 GFP_KENRL
意味着 kmalloc 能够使当前进程在少内存的情况下睡眠来等待一页. 一个使用 GFP_KERNEL 来分配内存的函数必须, 因此,
是可重入的并且不能在原子上下文中运行. 当当前进程睡眠, 内核采取正确的动作来定位一些空闲内存,
或者通过刷新缓存到磁盘或者交换出去一个用户进程的内存.
GFP_KERNEL 不一直是使用的正确分配标志; 有时 kmalloc 从一个进程的上下文的外部调用. 例如, 这类的调用可能发生在中断处理,
tasklet, 和内核定时器中. 在这个情况下, 当前进程不应当被置为睡眠, 并且驱动应当使用一个 GFP_ATOMIC 标志来代替.
内核正常地试图保持一些空闲页以便来满足原子的分配. 当使用 GFP_ATOMIC 时, kmalloc 能够使用甚至最后一个空闲页.
如果这最后一个空闲页不存在, 但是, 分配失败.
其他用来代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的标志, 尽管它们 2 个涵盖大部分设备驱动的需要. 所有的标志定义在
<linux/gfp.h>, 并且每个标志用一个双下划线做前缀, 例如 __GFP_DMA. 另外, 有符号代表常常使用的标志组合;
这些缺乏前缀并且有时被称为分配优先级. 后者包括:
GFP_ATOMIC
用来从中断处理和进程上下文之外的其他代码中分配内存. 从不睡眠.
GFP_KERNEL
内核内存的正常分配. 可能睡眠.
GFP_USER
用来为用户空间页来分配内存; 它可能睡眠.
GFP_HIGHUSER
如同 GFP_USER, 但是从高端内存分配, 如果有. 高端内存在下一个子节描述.
GFP_NOIO
GFP_NOFS
这个标志功能如同 GFP_KERNEL, 但是它们增加限制到内核能做的来满足请求. 一个 GFP_NOFS 分配不允许进行任何文件系统调用, 而
GFP_NOIO 根本不允许任何 I/O 初始化. 它们主要地用在文件系统和虚拟内存代码, 那里允许一个分配睡眠,
但是递归的文件系统调用会是一个坏注意.
上面列出的这些分配标志可以是下列标志的相或来作为参数, 这些标志改变这些分配如何进行:
__GFP_DMA
这个标志要求分配在能够 DMA 的内存区. 确切的含义是平台依赖的并且在下面章节来解释.
__GFP_HIGHMEM
这个标志指示分配的内存可以位于高端内存.
__GFP_COLD
正常地, 内存分配器尽力返回"缓冲热"的页 -- 可能在处理器缓冲中找到的页. 相反, 这个标志请求一个"冷"页, 它在一段时间没被使用. 它对分配页作 DMA 读是有用的, 此时在处理器缓冲中出现是无用的.
__GFP_NOWARN
这个很少用到的标志阻止内核来发出警告(使用 printk ), 当一个分配无法满足.
__GFP_HIGH
这个标志标识了一个高优先级请求, 它被允许来消耗甚至被内核保留给紧急状况的最后的内存页.
__GFP_REPEAT
__GFP_NOFAIL
__GFP_NORETRY
这些标志修改分配器如何动作, 当它有困难满足一个分配. __GFP_REPEAT 意思是" 更尽力些尝试" 通过重复尝试 --
但是分配可能仍然失败. __GFP_NOFAIL 标志告诉分配器不要失败; 它尽最大努力来满足要求. 使用 __GFP_NOFAIL
是强烈不推荐的; 可能从不会有有效的理由在一个设备驱动中使用它. 最后, __GFP_NORETRY 告知分配器立即放弃如果得不到请求的内存.
kmalloc 能够分配的内存块的大小有一个上限. 这个限制随着体系和内核配置选项而变化. 如果你的代码是要完全可移植, 它不能指望可以分配任何大于 128 KB. 如果你需要多于几个 KB
这方面的原因:
kmalloc并不直接从分页机制中获得空闲页面而是从slab页面分配器那儿获得需要的页面,slab的实现代码限制了最大分配的大小为128k,即
131072bytes,理论上你可以通过更改slab.c中的
cache_sizes数组中的最大值使得kmalloc可以获得更大的页面数,不知道有没有甚么副效应或者没有必要这样做,因为获取较大内存的方法有很
多,想必128k是经验总结后的合适值。
alloc_page( )可以分配的最大连续页面是4K
 static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order) 

/* 
 * Gets optimized away by the compiler. 
 */ 
 if (order >= MAX_ORDER) 
 return NULL; 
 return _alloc_pages(gfp_mask, order); 
 }

alloc_pages最大分配页面数为512个,则可用内存数最大为2^9*4K=2M

kzalloc 函数详解(转载)的更多相关文章

  1. malloc 与 free函数详解&lt&semi;转载&gt&semi;

    malloc和free函数详解   本文介绍malloc和free函数的内容. 在C中,对内存的管理是相当重要.下面开始介绍这两个函数: 一.malloc()和free()的基本概念以及基本用法: 1 ...

  2. Linux内核中kzalloc函数详解

    **************************************************************************************************** ...

  3. Linux中fork()函数详解&lpar;转载&rpar;

    [原创地址]http://blog.csdn.net/jason314/article/details/5640969 [转载地址]http://www.cnblogs.com/bastard/arc ...

  4. WinMain函数详解&lpar;转载&rpar;

    略加增添与修改! 工具:VC++6.0       系统:win7 64位 在Windows应用程序中,我们可以认为 WinMain() 函数是程序的入口,WinMain()的原型如下: int WI ...

  5. Interlocked&period;Increment&lpar;&rpar;函数详解 &lpar;转载&rpar;

    原文地址 class Program { static object lockObj = new object(); ; ; //假设要处理的数据源 , ).ToList(); static void ...

  6. 【转载】jQuery&period;extend 函数详解

    转载自:http://www.cnblogs.com/RascallySnake/archive/2010/05/07/1729563.html jQuery.extend 函数详解 JQuery的e ...

  7. 【转载】3D&sol;2D中的D3DXMatrixPerspectiveFovLH和D3DXMatrixOrthoLH投影函数详解

    原文:3D/2D中的D3DXMatrixPerspectiveFovLH和D3DXMatrixOrthoLH投影函数详解 3D中z值会影响屏幕坐标系到世界坐标系之间的转换,2D中Z值不会产生影响(而只 ...

  8. 【转载】C语言itoa&lpar;&rpar;函数和atoi&lpar;&rpar;函数详解&lpar;整数转字符C实现&rpar;

    本文转自: C语言itoa()函数和atoi()函数详解(整数转字符C实现) 介绍 C语言提供了几个标准库函数,可以将任意类型(整型.长整型.浮点型等)的数字转换为字符串. int/float to ...

  9. Linux中fork&lpar;&rpar;函数详解(转载)

    linux中fork()函数详解 一.fork入门知识 一个进程,包括代码.数据和分配给进程的资源.fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事, ...

随机推荐

  1. How parse REST service JSON response

    1. get JSON responses and go to : http://json2csharp.com/ 2. write data contracts using C# All class ...

  2. java异常和spring事务注解

    http://www.techferry.com/articles/spring-annotations.html http://www.oschina.net/question/2367675_23 ...

  3. 解决SecureCRT连接linux超时后断开

    出自:http://blog.csdn.net/zljjava/article/details/20285679 1.从客户端入手: 2.从服务器端入手(需要服务器权限) 修改/etc/ssh/ssh ...

  4. bzoj1072

    还是那句话s<=10 必然想到状压 题目唯一的难点在于怎么转移整除 整除即是mod d=0,我们用f[cur,j]表示选取状况为cur,余数为j的方案数 注意一个数a1a2a3…an (ai表示 ...

  5. python decimal&period;quantize&lpar;&rpar;参数rounding的各参数解释与行为

    我最开始其实是由于疑惑ROUND_FLOOR和 ROUND_DOWN的表现区别才看了一波文档,但是感觉拉出一票以前没有留意过的东西. 贴一个decimal文档里面的解释: ROUND_CEILING ...

  6. iOS&colon;用Block写一个链式编程

    一.介绍 链式编程是一个比较新颖的编程方式,简单直观,用起来也比较舒服.目前比较有名的Mansory和BabyBlueTooth就是使用链式编程写的第三方框架. 二.写法 链式编程写法不同于传统方式, ...

  7. SpringBoot不使用模板引擎直接返回html

    一.在resource目录下面建立文件夹,里面方静态页面. 路径:src\main\resources\static\page\index.html 访问:http://localhost:8080/ ...

  8. 滑动cell的时候执行动画效果

    滑动cell的时候执行动画效果 效果图: 源码: // // ViewController.m // AniTab // // Created by XianMingYou on 15/2/26. / ...

  9. java 文件指针复位

    BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream("userremain.l ...

  10. &lbrack;Swift&rsqb;八大排序算法(四):堆排序

    排序分为内部排序和外部排序. 内部排序:是指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列. 外部排序:指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存 ...