内核源码分析之linux内核栈(基于3.16-rc4)

时间:2021-01-06 12:32:06

在3.16-rc4内核源码中,内核给每个进程分配的内核栈大小为8KB。这个内核栈被称为异常栈,在进程的内核空间运行时或者执行异常处理程序时,使用的都是异常栈,看下异常栈的代码(include/linux/sched.h):

1 union thread_union {
2     struct thread_info thread_info;
3     unsigned long stack[THREAD_SIZE/sizeof(long)];
4 };

THREAD_SIZE值为8KB,因此内核为进程的异常栈(内核栈)分配了两个页框大小(页框大小4KB)。另外,进程的thread_info结构体保存在栈顶部。

此外,内核为每个cpu分配一个硬中断栈和一个软中断栈(这两个栈也是内核栈),用来执行中断服务例程和下半部(软中断),看看代码(arch/x86/kernel/irq_32.c)。这两个栈属于cpu,不属于进程,这和异常栈是有区别的。

1 DEFINE_PER_CPU(struct irq_stack *, hardirq_stack);
2 DEFINE_PER_CPU(struct irq_stack *, softirq_stack);

定义了两个数组hardirq_stack和softirq_stack,每个数组元素对应一个cpu,指向了该cpu的硬中断栈或者软中断栈。再来看下struct irq_stack结构体(arch/x86/include/asm/processor.h):

1 struct irq_stack {
2     u32                     stack[THREAD_SIZE/sizeof(u32)];
3 } __aligned(THREAD_SIZE);

可见,硬中断栈和软中断栈的大小均为8KB。

内核在执行中断处理程序时,在do_IRQ函数中会调用handle_irq函数,在handle_irq函数中要进行堆栈切换,代码如下(arch/x86/kernel/irq_32.c):

 1 bool handle_irq(unsigned irq, struct pt_regs *regs)
 2 {
 3     struct irq_desc *desc;
 4     int overflow;
 5 
 6     overflow = check_stack_overflow();
 7 
 8     desc = irq_to_desc(irq);
 9     if (unlikely(!desc))
10         return false;
11 
12     if (user_mode_vm(regs) || !execute_on_irq_stack(overflow, desc, irq)) {
13         if (unlikely(overflow))
14             print_stack_overflow();
15         desc->handle_irq(irq, desc);
16     }
17 
18     return true;
19 }

第12行中执行execute_on_irq_stack函数来判断是否需要堆栈切换,如果不需要,则执行if体的中断服务例程,即在当前堆栈中执行中断服务例程,如果需要切换堆栈,则在execute_on_irq_stack函数中切换堆栈并在该函数中(新堆栈中)执行中断服务例程。下面看下execute_on_irq_stack代码(arch/x86/kernel/irq_32.c):

 1 static inline int
 2 execute_on_irq_stack(int overflow, struct irq_desc *desc, int irq)
 3 {
 4     struct irq_stack *curstk, *irqstk;
 5     u32 *isp, *prev_esp, arg1, arg2;
 6 
 7     curstk = (struct irq_stack *) current_stack();
 8     irqstk = __this_cpu_read(hardirq_stack);
 9 
10     /*
11      * this is where we switch to the IRQ stack. However, if we are
12      * already using the IRQ stack (because we interrupted a hardirq
13      * handler) we can't do that and just have to keep using the
14      * current stack (which is the irq stack already after all)
15      */
16     if (unlikely(curstk == irqstk))
17         return 0;
18 
19     isp = (u32 *) ((char *)irqstk + sizeof(*irqstk));
20 
21     /* Save the next esp at the bottom of the stack */
22     prev_esp = (u32 *)irqstk;
23     *prev_esp = current_stack_pointer;
24 
25     if (unlikely(overflow))
26         call_on_stack(print_stack_overflow, isp);
27 
28     asm volatile("xchgl    %%ebx,%%esp    \n"
29              "call    *%%edi        \n"
30              "movl    %%ebx,%%esp    \n"
31              : "=a" (arg1), "=d" (arg2), "=b" (isp)
32              :  "0" (irq),   "1" (desc),  "2" (isp),
33             "D" (desc->handle_irq)
34              : "memory", "cc", "ecx");
35     return 1;
36 }

第7行获取当前堆栈的指针,第8行获取本地cpu的硬中断栈指针,第16行对二者进行比较,如果相等,则不需要切换堆栈(说明当前堆栈就是硬中断栈,也说明是在中断处理程序中时又发生了中断)。如果不相等,就要进行堆栈切换,第22-23行将当前堆栈指针保存在将要切换到的堆栈中(用于返回)。第28行,交换ebx和esp寄存器的值(实现了堆栈切换,将中断栈指针给了esp),第29行跳转到相应的中断服务例程,第30行从中断服务例程返回后,又将原来的堆栈指针赋给esp,切换到原先堆栈。第33行将中断服务例程函数名存放在%edi中。