分析Linux内核启动过程:从start_kernel到init

时间:2021-01-16 16:50:15

郑德伦 原创作品转载请注明出处《Linux内核分析》MOOC课程
http://mooc.study.163.com/course/USTC-1000029000
STEP1:在自己的linux系统中搭建实验环境。
1.下载linux-3.18.6的内核源码,并且编译

 cd ~/LinuxKernel/  wget https://www.kernel.org/pub/linux/kernel/v3.x/linux-3.18.6.tar.xz
xz -d linux-3.18.6.tar.xz
tar -xvf linux-3.18.6.tar
cd linux-3.18.6
make i386_defconfig
make # 一般要编译很长时间,少则20分钟多则数小时

分析Linux内核启动过程:从start_kernel到init
分析Linux内核启动过程:从start_kernel到init
2.制作根文件系统

  cd ~/LinuxKernel/
mkdir rootfs
git clone https://github.com/mengning/menu.git
cd menu
gcc -o init linktable.c menu.c test.c -m32 -static –lpthread
cd ../rootfs
cp ../menu/init ./
find . | cpio -o -Hnewc |gzip -9 > ../rootfs.img

3.启动MenuOS

  cd ~/LinuxKernel/
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img

然后就启动了MenuOS。
分析Linux内核启动过程:从start_kernel到init
STEP2:使用GDB调试内核跟踪启动过程。
在使用gdb跟踪调试内核之前需要先重新配置编译Linux使其携带调试信息。
由于make menuconfig需要ncurses-dev和tk4-dev库。
所以我们先输入命令sudo apt-get install ncurses-dev
和sudo apt-get install tk4-dev
然后输入make menuconfig进入Kernel Configuration界面
分析Linux内核启动过程:从start_kernel到init
选择Kernel hacking进入
分析Linux内核启动过程:从start_kernel到init
选择Compile-time checks and compilr options —>进入
分析Linux内核启动过程:从start_kernel到init
按Y选择Compile the kernel with debug info
然后执行make重新编译内核。
编译完成之后输入以下的命令,让CPU冻结在开始的时候。

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S # 关于-s和-S选项的说明:
# -S freeze CPU at startup (use ’c’ to start execution)
# -s shorthand for -gdb tcp::1234 若不想使用1234端口,则可以使用-gdb tcp:xxxx来取代-s选项

然后打开GDB远程调试,另外开启一个终端
输入gdb

(gdb)file linux-3.18.6/vmlinux # 在gdb界面中targe remote之前加载符号表
(gdb)target remote:1234 # 建立gdb和gdbserver之间的连接,按c 让qemu上的Linux继续运行
(gdb)break start_kernel # 断点的设置可以在target remote之前,也可以在之后

分析Linux内核启动过程:从start_kernel到init
在start_kernel设上断点然后
(gdb)c 继续执行到达断点处
输出(gdb)list显示出上下文
分析Linux内核启动过程:从start_kernel到init
我们继续设置断点, break rest_init()
然后输入c执行到断点处
然后输入list显示出上下文。
分析Linux内核启动过程:从start_kernel到init
STEP3:分析start_kernel的代码
内核几乎所有模块的初始化都会经过start_kernel来进行,

asmlinkage __visible void __init start_kernel(void)
{
.......
/*init_task即手工创建的PCB,0号进程就是最终的idle进程*/
set_task_stack_end_magic(&init_task);
........
/*初始化中断向量*/
trap_init();
/*内存管理模块初始化*/
mm_init();
/*调度模块初始化*/
sched_init();
....
/*其他初始化*/
rest_init()
}

我们再来看下最后的rest_init()

/*rest_init()会一直存在,是0号进程,并且创建了1号进程,并创建了一些其他的服务进程*/
static noinline void __init_refok rest_init(void)
{
int pid;

rcu_scheduler_starting();
/*
* We need to spawn init first so that it obtains pid 1, however
* the init task will end up wanting to create kthreads, which, if
* we schedule it before we create kthreadd, will OOPS.
*/
/*初始化了第一个用户态的进程1号进程*/
kernel_thread(kernel_init, NULL, CLONE_FS);
numa_default_policy();
/*创建内核线程管理系统资源*/
pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
rcu_read_lock();
kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
rcu_read_unlock();
complete(&kthreadd_done);

/*
* The boot idle thread must execute schedule()
* at least once to get things moving:
*/
init_idle_bootup_task(current);
schedule_preempt_disabled();
/* Call into cpu_idle with preempt disabled */
/*执行cpu_idle_loop, cpu_idle_loop是一个while(1)循环,当系统没有任何需要执行的进程的时候就调度到idle进程*/
cpu_startup_entry(CPUHP_ONLINE);
}

由此可见,rest_init()最后执行cpu_startup_entry();cpu_startup_entry会调用cpu_idle_loop(), 在cpu_idle_loop()里面有个while(1)的循环一直执行,作为idle进程,pid是0号,此进程会一直执行下去,并且在系统没有任何需要执行的进程时,调度到此进程。
Linux内核的启动在宏观上来看,就是start_kernel()来进行各种初始化工作,最终执行到rest_init()来初始化0号进程和1号用户态的进程。然后操作系统就运行起来了。