从硬件角度看Linux的内存管理

时间:2024-07-05 12:38:21

1. 分页机制

分段机制的地址映射颗粒度太大,以整个进程地址空间为单位的分配方式导致内存利用率不高。

分页机制把这个分配机制的单位继续细化为固定大小的页(Page),进程的虚拟地址空间也按照页来分割,这样常用的数据和代码就可以以页为单位驻留在内存中。而那些不常用的页可以交换到磁盘,从而节省物理内存,这比分段机制要高效很多。  

进程以页为单位的虚拟内存通过CPU的硬件单元映射到物理内存中,物理内存也是以页为单位来管理,这些物理页称为物理页面(Physical Page)或者页帧(Page Frame)。进程虚拟地址空间的页,我们称为虚拟页(Virtual Page)。操作系统为了管理这些帧需要按照物理地址顺序给每个页编号,叫作页帧号(Page Frame Number, PFN)。

分页机制的实现离不开硬件的实现,在CPU内部专门有一个硬件单元来负责这个虚拟页面到物理页面的转换,它就是一个称为内存管理单元(Memory Mangement Unit, MMU)的硬件单元。ARM处理器的内存管理单元包括TLB(translation lookaside buffer)和页表遍历单元(Table Walk Unit)两个部件。

  • TLB是一块高速缓存(Cache),用于缓存页表转换的结果,从而减少内存访问的时间。

一个完整的页表翻译和查找的过程叫作页表查询(Translation Table Walk),页表查询的过程由硬件自动完成,但是页表的维护需要软件来完成。页表查询是一个相对耗时的事情,理想的状态是TLB里面缓存有页表转换的相关信息。当TLB未命中时,才会去查询页表,并且开始读入页表的内容。ARM内存管理架构如下所示:

2. 页表

ARM32的虚拟地址VA[31:0]可以分成两部分:一部分是虚拟页面内的偏移量,以4KB页为例,VA[11:0]是虚拟页面内的偏移量;另一部分用来确定属于哪个页,我们称其为虚拟页帧号(Virtual Page Frame Number, VPN)。对于物理地址,也是类似的,PA[11:0]表示物理页帧的偏移量,剩余部分表示物理页帧号(Physical Frame Number, PFN) 。MMU的工作内容就是把VPN转换成PFN。处理器通常使用一张表来存储VPN到PFN的映射关系,这个表称为页表(Page Table, PT(进程都有自己独立的页表))。页表中每一个表项称为页表项(Page Table Entry, PTE)。 若将整张页表存放在寄存器中,则会占用很多硬件资源, 因此通常的做法是把页表放在主内存里,通过页表基地址寄存器(Translation Table Base Register, TTBR)来指向这种页表的起始地址。页表查询过程如图所示。处理器发出的地址是虚拟地址,通过MMU来查询页表,处理器得到了物理地址,最后把物理地址发送给内存控制器,从而访问物理页面。

3. 虚拟地址到物理地址的转换

下图展示了ARM32二级页表的查询过程,以4KB页为例,VA[31:20]用作一级页表的索引值,共有12位,最多可以索引4096个页表项;VA[19:12]用作二级页表的索引值,共有8位,最多可以索引256个页表项。当操作系统复制一个新进程时,首先会创建一级页表,分配16KB页面。本场景中,一级页表有4096个页表项,每个页表项占4字节,因此一级页表大小是16KB。当操作系统准备让该进程执行时,设置一级页表在物理内存中的起始地址到页表基地址寄存器中。进程执行过程中需要访问物理内存,因为一级页表的页表项是空的,这会触发缺页异常。在缺页异常里分配一个二级页表,并且把二级页表的起始地址填充到一级页表的相应页表项中。接着,分配一个物理页面,并把这个物理页面的帧号填充到二级页表的对应页表项中,从而完成页表的填充。随着进程的执行,它需要访问越来越多的物理内存,操作系统会逐步地把页表填充和建立起来。

当TLB未命中(Miss)时,处理器查询页表的过程如下图所示:

  • 处理器根据页表基地址控制寄存器TTBCR和虚拟地址来判断使用哪个页表基地址寄存器,是TTBR0和TTBR1。页表基地址寄存器中存放着一级页表的基地址。
  • 处理器根据虚拟地址的bit[31:20]作为索引值,在一级页表中找到页表项。一级页表一共有4096个页表项。
  • 一级页表的页表项中存放有二级页表的物理基地址。处理器将虚拟地址的bir[19:12]作为索引值,在二级页表中找到相应的页表项。二级页表有256个页表项。
  • 二级页表的页表项里面存放有4KB页的物理基地址,因此处理器就完成了页表的查询和翻译工作。

Note:

一级页表相当于把一本书缩小成几页的目录,通过目录来查询书的内容。但是有个问题,如果书非常厚,目录页非常多,那自然而然可以继续分,把一级目录当成一本教材,再建立一个目录,二级页表由此诞生,就是把页表当成教程,再建立页表。