【Linux】进程概念(上)

时间:2022-12-25 08:02:35

​???? 作者:@阿亮joy.
????专栏:《学会Linux》
???? 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根
【Linux】进程概念(上)

????冯诺依曼体系结构????

我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系。
【Linux】进程概念(上)
截至目前,我们所认识的计算机,都是由一个个的硬件组件组成的。

  • 输入单元:包括键盘, 鼠标,扫描仪, 写板等
  • *处理器(CPU):含有运算器和控制器等
  • 输出单元:显示器,打印机等

关于冯诺依曼体系结构,必须强调几点:

  • 这里的存储器指的是内存,内存掉电易失。而磁盘输入外存,其具有永久性存储能力。
  • 不考虑缓存情况,这里的 CPU 能且只能对内存进行读写,不能访问外设(输入或输出设备)。
  • 外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取。
  • 一句话,所有设备都只能直接和内存打交道。
  • 有些硬件既是输入设备,又是输出设备,如磁盘和网卡。
  • 外设是相对于内存和 CPU 而言的。
  • 运算器 + 控制器 + 其他 = CPU。
  • 所有的外设有数据需要加载,只能加载到内存中。内存写出数据,也是写到外设中。
  • CPU 不和外设直接打交道,只能和内存直接打交道。

CPU 在读取和写入数据的时候,在数据层面上,只和内存打交道是为了提高整机运算效率。因为磁盘的速度是较慢的,内存的速度是较快的,CPU 的速度是快的,如果 CPU 直接向磁盘读取和写入数据,就会降低了整机的运算效率。

CPU 很快,但也很笨。它只能被动地接收别人的指令和数据,然后执行别人的指令和计算别人的数据。CPU 中有自己的指令集,分为精简指令集和复杂指令集。而编译代码的本质就是形成二进制可执行程序,翻译成 CPU 能够认识的指令,让 CPU 帮我们做计算。

【Linux】进程概念(上)
程序要运行必须加载到内存中。那为什么要加载到内存中呢?CPU 要执行我的代码,访问我的数据,只能从内存中读取,这是冯诺依曼体系结构规定的!

对冯诺依曼体系结构的理解,不能只停留在概念上,要深入到对软件数据流理解上。请解释,从你登录上 QQ 开始和某位朋友聊天开始,数据的流动过程。 从你打开窗口,开始给他发消息,到他的到消息之后的数据流动过程。如果是在 QQ 上发送文件呢?

首先,先将我们 QQ 程序加载到了内存,CPU 再执行 QQ 程序的代码。如果我们从键盘中输入“你好”并点击发生,“你好”这个信息先加载到内存,然后再交给 CPU 处理,最后 CPU 将结果交给内存,内存再将结果交给显示器和网卡。经过网络传输后,朋友电脑的网卡接收到信息,然后交给其内存中,然后经过 CPU 处理后,再显示到朋友电脑的显示器上。

【Linux】进程概念(上)

????操作系统(Operator System)????

在之前的博客,我们提到过:操作系统是一个进行软硬件资源管理的软件。为什么要管理呢?操作系统要通过合理地管理软硬件资源(手段),为用户提供良好的(稳定的、高效的和安全的)执行环境(目的)。

那操作系统是如何将软硬件资源管理起来的呢?为了更好地理解操作系统是如何管理软硬件资源的,我们先来看一下生活中的例子:在学校里,假如校长(管理者)从未和学生(被管理者)进行过交流,校长也能够很好地将学生管理起来。那么,我们可以得出一个堆管理者的理解:管理者不需要和被管理者进行直接交互,也能够把被管理者管理起来。管理者对重大事宜有决策的权利的,而决策是有依据的。那这是怎么做到的呢? 虽然学生不直接和校长打交道,但是学生的所有数据(绩点、各科成绩等)早已经被校方拿走了,而且这些数据一直都在更新。那么,校长只要管理好这些数据,就能将学生管理起来了。总的来说,管理的本质就是:对数据做管理。

【Linux】进程概念(上)

管理者是通过被管理者的数据来进行管理的。那管理者是如何一直拿到这些数据呢?那么管理者和被管理者之间还有执行者,执行者会执行管理者的决策以及和被管理者接触,拿到被管理者的数据交给管理者。在学校里,校长就是管理者,辅导员就是执行者,学生就是被管理者。而在计算机里,操作系统就是管理者,驱动程序就是执行者,硬件就是被管理者。

【Linux】进程概念(上)

  • 管理者通过对数据进行管理实现对被管理者的管理
  • 数据的采集和决策的执行由执行者来做

校长要管理的学生很多,那么需要管理学生的信息也很多,但是需要管理的信息种类是一样的。那么,一个学生的各种信息可以定义成一个结构体,每个学习的信息结构体链接在一起就形成了链表。那么现在对学生数据做管理就变成了对链表做管理。

【Linux】进程概念(上)

那么,以上的过程就是先描述(面向对象),再组织(数据结构)。其实,所有的管理,本质逻辑都是先描述,再组织。

【Linux】进程概念(上)

  • 管理的本质是对数据进行管理
  • 管理的方法是先描述,再组织

以上是操作系统对硬件的管理方式,其是操作系统对软件也是这样子进行管理的。软件能管理硬件,也能够管理软件。

操作系统是不相信任何人的,它是很容易受到伤害的,但是操作系统也必须给上层用户提供各种服务。那如何解决呢?那么,在用户和操作系统之间还有一层系统调用接口,而这些接口也是用C语言写的,如:fork 和 wait 等等。

【Linux】进程概念(上)
【Linux】进程概念(上)

在系统调用上面还有一层,分别是 shell 、C / C++ 的库(lib)和界面等。shell 可以满足用户的指令操作,C / C++库满足用户的编程操作,它们都需要系统调用接口来完成相关操作。

系统调用和库函数的概念

  • 在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用。
  • 系统调用在使用上,功能比较基础,对用户的要求相对也比较高。所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库。有了库,就很有利于更上层用户或者开发者进行二次开发。

计算机软硬件体系结构

【Linux】进程概念(上)

????进程????

什么是进程

在课本上,我们经常会看到一个运行起来(加载到内存)的程序就是进程、进程和程序相比具有动态性等等的说法。其实,这些说法都是不全面的。那么接下来,我们一起探讨什么是进程?

我们写代码经过编译和链接后,形成了可执行程序。而程序的本质是在磁盘上放着的文件。程序想要运行起来,首先需要加载到内存。那么,内存了肯定会有很多被加载进来的程序,那么操作系统如何管理这些程序呢?是不是先描述,在组织啊?

为了描述这些程序,就引入了进程控制块(Processing Control Block)的概念。而进程等于内核数据结构(struct task_struct)+ 进程对应的磁盘代码。

【Linux】进程概念(上)
【Linux】进程概念(上)

task_ struct 内容分类

  • 标示符: 描述本进程的唯一标示符,用来区别其他进程。
  • 状态: 任务状态,退出代码,退出信号等。
  • 优先级: 相对于其他进程的优先级。
  • 程序计数器: 程序中即将被执行的下一条指令的地址。
  • 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
  • 上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
  • I/ O状态信息: 包括显示的I/O请求,分配给进程的I/ O设备和被进程使用的文件列表。
  • 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
  • 其他信息。

查看和杀死进程

【Linux】进程概念(上)

ps ajx | head -1 && ps ajx | grep '进程名' #查看指定进程
kill -9 进程的PID #杀死指定进程

【Linux】进程概念(上)

【Linux】进程概念(上)
注:PID (Process ID)是进程的标识符。grep 指令也是一个进程。进程在调度运行的时候,进程具有动态属性

【Linux】进程概念(上)

【Linux】进程概念(上)

【Linux】进程概念(上)

注:getpid 函数是获得当前进程的 PID,而 getppid 函数是获得当前进程的父进程的 PID。

查看进程目录 ls /proc

【Linux】进程概念(上)

【Linux】进程概念(上)

【Linux】进程概念(上)
注:删掉进程对应的可执行程序,进程还可以跑。因为进程跑起来就和可执行程序没有什么太大的关系了。Ctrl + C 可以退出前台程序。

如果我们把我们的进程退出再运行起来,如此重复。我们会发现一个现象:子进程的 ID 一直在变,而父进程的 ID 一直不变。这是为什么呢?

【Linux】进程概念(上)
那么,我们就来看看这个父进程是什么。

【Linux】进程概念(上)
其实该父进程就是 bash,该进程是云服务器开启时系统帮我们创建好的。一般情况下,命令行上启动的进程的父进程都是 bash。shell 以创建子进程的方式来跑我们的程序,子进程出问题了,父进程不会受到任何的影响。那 shell 是如何创建子进程将我们的程序跑起来的呢?这部分内容将在进程控制里讲解。接下来,我们来学习一下如何创建子进程。

创建子进程

fork 是一个创建子进程的函数。

【Linux】进程概念(上)

注:vim 的批量化注释:先摁下 Ctrl + V 键,再连续摁下方向键(j - 向下,k - 向上)至你想要注释的内容,再摁下 Shift + i 键,最后输入 // 就可以实现批量化注释了。
【Linux】进程概念(上)

【Linux】进程概念(上)

上面只是一个小小的例子,我们通常不这么来写代码。

对于 fork 函数,我们重点研究它的返回值。如果子进程创建成功,将会给父进程返回子进程的 ID,给子进程返回 0。如果子进程创建失败,将会给父进程返回 -1。

【Linux】进程概念(上)
知道了 fork 函数的返回值后,我们对上面的代码再进行修改并让程序跑起来。

【Linux】进程概念(上)
【Linux】进程概念(上)

上图的结果,很好地说明了子进程创建成功,将会给父进程返回子进程的 ID,给子进程返回 0。但我有一个问题,为什么同一个变量 id在后续不会被修改的情况下有不同的内容呢?现在这个知识点,无法给大家讲解,这里涉及了进程地址空间的内容。

fork 函数真正的用法是利用分支结构来让父子进程执行不同的代码,那我们再把上面的代码修改一下。

【Linux】进程概念(上)

【Linux】进程概念(上)
现在父子进程在一起运行,那么这就是多进程了。那现在问题来了,如果是 C语言的话,if - else if - else 结构能够同时成立吗?很明显不能!但是现在似乎可以了。其实真正的原因是 fork 函数执行之后,会有父子进程两个进程在执行后续的代码,也就是说 fork 函数之后的代码,被父子进程共享。那么,我们就可以通过返回值的不同,让父子进程执行后续共享代码的一部分。

????总结????

本篇博客主要讲解了冯诺依曼体系结构,什么是操作系统、库和函数调用的区别、什么是进程、如何查看和杀死进程以及如何创建子进程等等。那么以上就是本篇博客的全部内容了,如果大家觉得有收获的话,可以点个三连支持一下!谢谢大家!????????❣️