走进Linux 操作系统
摘要:本期涉猎了操作系统的来龙去脉后与大家携手步入Linux世界。我们力图展示给大家一幅Linux系统的全景图,并为了加深对linux系统的全面认知,亲手搭建了一个能运行在内存中的试验系统。同时为大家提供了几个shell脚本帮助建立试验系统。
最熟悉的陌生人
用萧亚轩的一首歌形容操作系统给我们的感觉再合适不过了,“最熟悉的陌生人”。
说熟悉,因为几乎每天我们都在有意无意和它打着交道。无论是日常办公,还是畅游网际,我们都无法离开操作系统的帮助。电脑初启,首当其冲运行的就是操作系统。对于许多人而言,电脑就是那扇“窗”。即便远离电脑,我们依然无法逃脱操作系统的“魔掌”。在您收发短信、拨打电话的时候,手机屏幕背后一个嵌入操作系统正在默默为您服务。越来越多的数字设备都开始拥有自己操作系统,虽然它们不同于Bill为我们带来的“窗子”,但并无什么本质的差别。假如有一天,您的电视机开始对您嘘寒问暖,请别忘记,有一个叫做操作系统的东西站在它的背后。
说陌生,因为直接为我们服务的大多属于应用软件,也许是文字处理、也许电子邮件、也许网络游戏。他们都运行于操作系统之上,提供我们所需的服务,这让我们很少直接面对操作系统。对大多数用户而言,操作系统的细节是不可见的,所以虽说我们无时无刻不在使用操作系统,彼此之间却多了一层隔阂。对于操作系统的认识,往往只能停留在间接地、片面地感性基础之上,其内部的运作机制,我们无法一目了然。
无处不在却不以正面相示,让操作系统有了一种“犹抱琵琶”的美,于是操作系统被冠以“最神秘”的称号。
揭开这层神秘面纱,是我们杂志的初衷。我们希望能够诠释操作系统设计思想,和您一起熟悉操作系统提供的各种服务,学习灵活运用这些服务的方法和技巧。我们将以理论讨论结合实例实验方式,让您和我们一起拥有操作系统级开发软件的本领。
好了,开始我们的内核之旅,走近这个“最熟悉的陌生人”吧!
本期目标!
在第一期中,我们将:
提纲挈领地介绍操作系统的基本概念;
理清楚操作系统和其它系统软件或应用软件之间的关系;
了解操作系统的体系结构;
在此基础上,提出操作系统内核概念。
简而言之,希望读者可以在读过本期的内容,能在脑海里勾勒出一幅操作系统的全景图,为日后剖析内核、开发内核创造基础。
学习的最佳方法是实践。
我们的杂志将以实践为主,理论为辅。将实验贯穿到学习、分析当中。
在本期中,为了让读者能比较全面地理解操作系统,并加强对操作系统的感性认识,我们将本期分为两大部分:
第一部分从理论上简要介绍操作系统的内涵,揭示操作系统在软件体系中的特殊地位,然后讨论操作系统的体系结构和演化进程。
第二部重点分析Linux操作系统,介绍Linux操作系统的发源,特色以及内核结构。最后通过和读者一同亲手搭建一个实验操作系统——一个经过裁减具备基本功能的小型Linux,让读者从实践中感受操作系统的体系结构和在计算机系统中所起的作用。
什么是操作系统
操作系统的概念
虽然定义总是生硬、乏味、令人费解,但是它毕竟是概括性最强、最能体现水平的,所以我们还是要在开始就给出操作系统定义:
操作系统是应用程序的运行环境。够精辟吧!
可能运行环境这个术语令你如坠云端,它太广泛、太抽象了。你一定在问运行环境到底是什么?简单地讲,运行环境是一种即服务和控制于一体地容器。
如果你没有理解环境这个概念,我可以举个并不贴切的社会实例。
在开发区中可以看到许多企业孵化池或产业园,其中入住了各种各样的企业,孵化池或产业园的管理机构会统一为其中的企业办理各种工商、保险、卫生医疗等手续、提供后勤、治安等基础服务,企业需要某些政务服务时,可以通过管理机构去和*联系,处理相关事宜,而不需要亲自去处理这些和企业业务无关的政务活动,因此可以抽出身来集中精力在业务上。孵化池和产业园为企业提供了统一、普遍地服务和管理,是企业运作的外在环境。操作系统从这个意义上来说,类似于产业园的管理结构,为应用程序——好比企业——提供基础服务和管理。
当然,我们现在并不指望你立刻认识到操作系统深刻内涵,对它的认识需要在不断地使用和思考中消化和积累,在本期杂志中,我们将从各种角度介绍“运行环境”这个术语的真实含义,并在今后各期杂志中分阶段、分层次的展开学习操作系统的各个领域。相信在不久的将来,你就能和我们一起认清它的庐山真面目了。
操作系统产生背景
想要认清一个人,最好是从小认识他。对技术的理解也是如此,我们必须了解它的产生原因和发展过程,才能较为全面的认识该技术所解决的问题,认识它在学科发展中所处的地位。对比技术发展各个阶段的特点,才能认清该技术的优劣。同样,我们想要把握操作系统的特性,还是先把操作系统放在时间轴上看看它的来龙去脉吧!
操作系统并不是计算机出现之初就有的,最初的计算机科学中并不存在操作系统这个概念,所有任务都直接运行于硬件之上。那时的任务大多集中于科学计算领域,系统硬件实现相对简单、直接,任务对I/O操作的要求也比较低,将结果记录到磁带机之类的简单设备中足矣。老程序员们大多采用手工或是用打孔机的方式将将二进制数据和程序输入机器内存,然后执行计算,最后,将结果保存到磁带机上。一旦出现错误,机器上的调试灯会将保存在寄存器中的错误代码反映出来,程序员们会据此去分析错误所在。
随着科学计算任务变得越来越复杂,计算机逐渐被应用到了科学计算以外的其它领域。硬件设备比以前更加丰富和复杂了,I/O操作要求大幅提高,程序规模迅速扩大,需要调试的错误更是直线上升,直接操作硬件,对程序员来说变得越发困难。
于是出现了高级语言、编译系统,帮助程序员简化开发工作;出现了操作系统,帮助程序员管理和操作硬件设备。程序员们可以将精力集中于开发需要的任务,烦琐的如任务装载、分配/释放内存、内存寻址、设备驱动、数据存储等等硬件相关操作统统交给操作系统管理——真可以说是生产力的一次解放。
时代继续发展,多用户多任务时代的来临,使得系统管理更加强调资源共享性。用户直接操作系统资源显然有悖于上述精神,因此资源合理分配与保护更为操作系统发展提供了新的挑战和机遇,同时奠定了操作系统不可或缺的地位,从此,操作系统成为为软件体系中最基础,最重要的组成部分了。
操作系统的任务
从操作系统的起源可以看出,操作系统的核心任务是作为硬件和应用程序之间的一个中间层,或者说是应用程序的一个操作平台,通过它应用程序和系统硬件隔离开,应用程序利用它提供的服务完成硬件相关操作。
总而言之,操作系统方便了应用程序运行,保护了系统资源。具体地讲,操作系统为用户带来了几个方面的好处:
易操作性: 操作系统是用户和计算机之间的接口,它大大简化了用户执行任务的复杂程度。
作为应用程序的执行环境:它为程序员建立应用程序提供了必要的编辑环境、编译环境和调试工具;为程序的执行提供了载入服务和资源分配服务;为数据存取提供了I/O访问服务;为数据格式转化和定位提供了文件操作服务;为程序的安全运行提供了权限控制服务;为程序运行失败提供了错误报告服务等等系统服务,从此,程序员和用户都不再需要关心那些令人生畏的计算机体系结构细节,可以全心全意地开发应用程序了。
有效性:从另一个角度看待操作系统,可以将它认为是一个计算机资源管理系统。
由于系统中资源种类各异,用法也大不相同,如果直接由用户管理这些资源,比如内存分配,时钟计时,I/O驱动,存储维护,势必要求用户具有丰富的软硬件知识,深刻把握计算机系统结构,否则资源将难以合理使用,最终造成系统混乱,甚至崩溃。而且现代的多用户操作系统更是要求系统资源共享,资源必须合理分配给多用户、多任务,只有采用一定的调度策略和分配策略,才能保证资源被公平有效的利用。所以,配置资源成了提高性能的关键——如同资源配置是提高生产力的关键一样。
安全性:安全性是操作系统为我们提供的另一个重要的特点,它为我们提供了多层面的安全保障。
首先,操作系统作为系统硬件和用户的中间平台,禁止应用程序直接操作硬件,禁止应用程序直接访问内存,执行特权指令。多数系统都将应用程序运行限制在用户空间(低特权级),而操作系统则运行于内核空间(高特权级),应用程序只有通过系统调用请求操作系统所提供的接口,才能通过操作系统间接执行和硬件相关的操作或是执行特权指令。因此保护了系统不被恶意的应用程序破坏或非法操作。
其次,多任务多用户操作系统必须保证,不同任务之间信息不能泄漏,因此需要为任务划分各自的私有空间和对其进行访问控制。对不同用户进行相应的授权和认证,可以保护用户各行其是,互不侵犯。
总之,操作系统安全涉及方方面面,健壮的操作系统必须能多方位地保证任务安全执行。
易扩展:计算机技术的高速发展和计算机日益普及,计算机硬件设备不断推陈出新,这要求操作系统提供的服务也能够日新月异,因此要求操作系统具有良好的扩展性。
由于操作系统对系统资源和服务进行了抽象,屏蔽了底层细节,统一了上层接口,添加设备或服务成了一件轻而易举的事,需要做的仅仅是,在设备或服务规定的接口下完成新的实现即刻。
什么是资源?
资源概念在操作系统中使用得相当广泛,内存、磁盘、文件、处理器、时钟等等软硬件都可以划归到资源范畴。资源的概念其实很好理解,概括来讲,系统中的资源指的是系统提供给进程使用的特殊实体,进程通过向操作系统请求获得这些实体,另外,系统分配这些实体给进程前,进程需要挂起等待。凡是满足上述条件的实体就属于资源。
操作系统的演化
和其它任何事务一样,操作系统并非一成不变。迄今为止,它已经经历了半个多世纪的发展,已经形成了一个庞大的家族。从个人计算机到工作站,从通用系统到专用系统,从嵌入式到虚拟机,可谓形式丰富多样。我们难以将所有操作系统囊括,只希望提纲挈领地介绍在操作系统发展进程中具有代表性的几种系统,理清它的演化脉络。
进化历程 :
最早的操作系统是简单的单道批处理系统。它的功能相当简陋,只能串行执行预先组织好的任务组。早先的系统一次只能运行一个任务,每个任务必须先装入,再等执行完后才能装入下一个任务,重复的装入浪费了大量的时间。单道批处理系统的出现,大大的提高了系统吞吐率。
事情并非总如想象般顺利。
由于数据存储时所消耗的时间——I/O操作时间——相比数据处理时间——CPU操作时间——要高出数倍(往往在20倍以上),所以程序运行到I/O操作期间,CPU总是需要停下来(挂起)等待数据传输完成,无形中浪费了大量宝贵的时间,任务组中后续程序的执行也因此被延迟了。如何避免数据传输等待带来的时间浪费呢?能否在进行传输期间,解放CPU去执行别的任务呢?
为解决这个瓶颈,单道批处理系统进化到了多道批处理系统。
所谓多道就实际就是说,处理器(当然现在谈到的都属于单处理器系统)可以交错运行多个程序,某个任务挂起时,运行另一个程序。这样一来, CPU等待数据传输造成的时间浪费问题得以解决,系统吞吐率又一次得到了提高。
计算机的发展使得任务不再仅仅局限于科学计算,越来越多的应用于办公、生活等日常活动中。科学计算中的任务多数执行路径都是固定不变,预先定义好的,只需要给定输入,得到结果期间程序执行中途不需要外界干预,与之不同,办公,生活中的许多任务都必须和用户不断交互,任务结果随时都会因为用户的选择改变。这时的系统变得更公开、更普遍,往往允许多个用户可以同时使用。交互模式和共用模式需要任务响应时间尽可能的快(超过20秒的话,人的思维就容易被打断或变得很不耐烦),这样才能让多个用户都满意,于是操作系统开始采用分时技术,处理器的运行时间分成数片,均分或依照一定权重派发给系统中的用户使用。这种将处理器虚拟给多用户共同使用的方法,不但可以满足快速响应,而且也可以使得所有用户获得计算机完全是在为自己服务的假象。
上面给出了操作系统发展的主流路线:单道批处理——多道批处理——分时系统,除此以外现在还出现了许多分布式操作系统,嵌入系统,不过总体技术思路都仍然脱离不了多道、分时等概念。
操作系统内容
操作系统的演化使得其功能变得愈来愈强大,但结构也越来越复杂。在以方便用户(包括开发人员和终端用户)为宗旨的思想下,操作系统不断集成新功能,新服务。回忆从前大家使用的DOS系统仅仅只需要一张软盘,而如今的windows系统或Linux系统动辄就需要数张光盘,可见已经从过去的麻雀变成了恐龙——虽然它们都有五脏六腑。
虽然变成了恐龙,但是其结构还时相对稳定,清晰的。和软件工程提出的思想一致,操作系统也采取了分层结构,越向上层抽象都越高,越接近用户;相反越向下层,越靠近硬件,抽象也相对接近硬件。而且高层软件依靠下层软件提供的服务,再加上本身提供附加服务为更高层服务。总体来讲呈现倒金子塔形式。
下面我们就简要分析一下操作系统的体系结构,然后再谈谈操作系统设计时需要主要考虑的问题。
操作系统组成
在形形色色的操作系统之中,组成结构不尽相同。因为同样目的实现的手段可以*选择,所以其组成也有很大差异,我们选取最普遍的操作系统(UNIX)组成结构,向大家揭示操作系统的体系结构的大致框架。对于各种操作系统之间的具体差异,大家可以以下面讲述的结构对比认识。(注意我们这里所说的操作系统属于宏观概念,接近于操作系统发行版,不但包括了内核,还包含了学多系统软件和基础应用软件。)
操作系统最底层的组件是内核,其上层搭建了许多系统软件。系统程序包括三个部分。这三个部分分别是:编译环境、应用程序接口和用户接口。编译环境包含汇编,C 等低高级语言编译程序,连接程序和装载程序,这些程序负责将文本格式的程序语言转变为机器能识别和装载的机器代码;应用程序接口(API)包含内核提供的系统调用接口和语言库,系统调用是为了能让应用程序使用内核服务,语言库函数则是为了方便应用程序开发,所以将一些常用的基础功能预先编译以供使用,比如对C语言来说常用的C库有gun C等;用户接口(AUI)包括我们熟悉的shell(关于shell 应该专门写一个教程)、系统服务程序和常用的应用程序。
这些部分并非所有的操作系统都必须一个不少的包含,不过其中大多数功能都应该提供,尤其内核,系统调用,shell这些基本组件,它们都属于操作系统必备组件,其它组件是否包含需要根据具体系统的要求和应用环境决定,你也可以将其归为操作系统之外的附加部分。
系统程序:系统程序是相对应用程序而言的,应用程序针对终端用户需求完成功能,而系统程序则是为了简化应用程序的开发而存在的,比如数据库系统为了应用程序提供了有效的数据传输,存储服务;还有编程语言的执行环境——它由C库实现——也属于一种系统程序,它为应用程序开发提供了诸如I/O操作例程,图形库,计算库等等基础服务。可见系统程序范围覆盖很广,只要面相服务群体不是最终用户的软件都可以划归到系统软件中来。
内核概念
操作系统最核心,最基础的组件就要属内核了——内核和操作系统的其它系统软件或应用程序本质的区别在于内核运行在高特权级,和硬件直接交互,操作权限几乎不收任何限制,因此内核程序编写也要求格外谨慎,必须保证效率和可靠。
特权级别:现代体系结构中往往为了保护操作系统(内核)专用的数据不被应用程序访问,以免关键数据泄露或系统被破坏,将系统(硬件机制)划分为不同的特权级别,敏感数据存在高特权级,且还规定了一些特权指令,其它级别的任务不能访问敏感数据和使用这些特权指令,只有处于特权级别的任务才有权使用。比如Ox86体系结构中存在4个特权级别(0,1,2,3)Linux操作系统将内核存在0级,其它任务运行在3级。0级被称为内核空间,3级被称为用户空间。
内核设计的主要任务
内核作为操作系统的核心,运行级别最高。其它系统程序都必须通过它才可以使用系统资源,获取系统服务。所以内核使用最为频繁,一切系统行为无论巨细都要通过内核参与。
因此内核运行效率和正确性对整个系统的运行效率和可靠性至观重要,如果内核效率稍微下降,那么在应用程序中就必然造成层层放大。
内核要求高效率,所以它必须自系统运行起就要载入内存,并且在运行期间一直驻留在内存中,直到系统关闭。这是内核与其它应用程序或系统程序的另一个显著区别。虽然说内存今天已经不再是天价了,但是毕竟内存容量有限,所以内核大小不能过大(Linux内核只有几M或十几M,甚至可以裁减得更小),因此内核只应该包含最基础和核心的功能,其它附加功能应该尽量提到用户空间完成。
那么到底有那些功能是操作系统使用最频繁,最需要在内核中实现的呢?内核直接架构于硬件资源之上,因此首先要做的就是对硬件的资源管理。因此内核必须负责:内存管理,进程和进程调度(对CPU的管理),文件系统管理,I/O处理等任务。
我们的杂志核心就是在解释内核原理的基础上,带领大家学习内核级别的开发,也就是说进行核心开发。本期仅仅给大家一个概念上的说明,描述内核设计需要完成的主要任务,至于具体内核各部分的详细讨论在后续期刊中将逐步展开。
内核至少需要包含如下几个模块。
进程管理:进程是操作系统中的执行代码,是任务在系统内的动态化身。内核必须负责将任务抽象为进程,而且必须能将进程执行,能为进程分配资源,维护进程的执行状态,提供进程间通讯方法。更进一步讲,进程管理还必须保证进程运行的可靠性,因此需要提供进程同步,互斥,防死锁等等服务,另外进程调度也是进程管理中的重要任务。
内存管理:计算机存储部件由快到慢、由小到大分为缓存、内存和磁盘。其中最主要和必须是内存,内存管理包括内存的分配和释放,以及访问保护等。另外对使用虚拟内存的系统,内存管理还包含虚拟内存管理,磁盘交换管理,内存影射等等。
文件系统:文件是多数系统中用户使用和管理数据的主要方式,文件系统需要负责用户文件访问,访问权限控制,文件格式转换,数据传输等一系列问题。
设备管理:除了存储设备外,系统还有大量外设需要操作系统管理,比如时钟,网卡,键盘,磁盘等等,设备管理需要负责驱动这些设备为上层调用服务。
I/O管理:操作系统中I/O管理负责处理复杂的I/O操作,其中包括I/O缓冲和磁盘调度等。
另外中断管理也是操作系统内核应该实现的功能。
以上是操作系统内核设计要考虑的主要问题,其中各种模块彼此相互交错、相互利用。不过这些模块的划分并不是绝对的,在实际系统中可能有不同的组合或更细致地划分,因此我们不必追究模块的具体内容,需要关注的是内核究竟需要完成那些功能。
内核模块大致也有层次之分,我们可以这样理解层次含义:直接和硬件作用的是硬件抽象层,和用户更靠近的属于逻辑抽象层。
所谓硬件抽象层,是指管理硬件设备的模块,比如存储管理、设备管理这些模块将硬件功能抽象为内核数据结构和接口函数,以供上层使用。比如磁盘设备驱动,需要将磁盘设备功能抽象为打开open,写入(write),读取(read)等接口函数;内存管理需要将内存抽象为页、段等结构体。然后分配、合并、释放等工作都是通过操作这些抽象得来的结构体,再由这些结构影射到内存的物理实体上去的完成实际操作的。
所谓逻辑抽象层最主要的目的是为了贴近用户需求,最重要的逻辑抽象模块就是文件系统,文件系统的存在完全是从用户角度出发设计的,因为用户最能接受以用文件形式包装的信息,所以文件系统属于逻辑上的抽象,因为物理设备中没有对应文件的实体。
对于进程管理来说,其中进程执行和调度要和处理器打交道,应该说属于硬件抽象层,但其中进程状态维护,进程通讯等更接近用户使用,因此可以归结到逻辑抽象层。
另外I/O管理和中断管理些模块,在内核中属于为其它模块服务的借用力量,它们主要被文件系统或设备管理模块使用,但总之是面向硬件的,所以也可以将其归为硬件逻辑层。
Linux操作系统
在众多商业操作系统和免费操作系统中,Linux占有独到地位,它不但功能强大,接近于工业强度,而且结构设计幽雅,具有良好的扩展性和移植性,接口定义规范,基本和Unix系统兼容。更为重要的优势在于Linux操作系统是最具影响力的开源软件,它的产生揭开了开元运动的新纪元,对*软件发展起到了前所为有的推动作用。
Linux开放性,也就是它不拘一格的拿来主义精神,吸引了无数软件爱好者热情的投入到其开发中去,因此Linux是当今发展最快,范围最广的开元软件之一。它是社区中大家最乐意讨论和参与的项目,也正是这种开源精神使Linux成为操作系统爱好者最好的良师益友,它在教育意义上的贡献是前所未有的。从这节起我们将进入Linux世界去探索操作系统软件的严谨,去感受Linux的可爱。
Linux操作系统的起源
Linux的第一个版本诞生于1991年,它的作者就是现在大名鼎鼎Linus Torvalds,这个芬兰小伙子据说最初是在做一个作业调度系统的学校家庭作业,后来他突发灵感开始着手将系统改造为一个实用的操作系统,他在开发初期借助了当时最负盛名的教育类操作系统Minx的一些思想和成果,但他的雄心是要将自己这个系统变的比Minx更实用、更强健,因此他决定把自己的系统代码公布于众,并且欢迎任何支援者来修改和扩充Linux系统——这正是我们现在耳闻祥熟的GUN协议的权益——Linux选择了当时在世界上最受推崇的Un ix系统接口标准:POSIX.1来作为自己的内核系统调用接口,从此Linux成为了Unix风格操作系统家族中的新贵,而且是一个代码完全公开的操作系统。
Linux的生命力来自于它的开源思想,自Linus公开Linux代码一来,世界各地的软件工程师和爱好这不断积极地对Linux系统今进行修改和加强,先后将其版本从0.1 提高到2.0 、2.2、2.4到如今的2.6,同时Linux也被从初期的x86平台移植到了Powerpc、Sparc、MIPS、68K等几乎市面上能找到的所有体系结构上。更另人激动的是,拜开源运动之新风,数不胜数的应用软件出现在Linux系统之上,这样大大加强了Linux系统的实用能力。
Linux作为开源软件中的桂冠,越来越受到欢迎,毫无疑问地成为人气最旺,最活跃的gun项目,围绕Linux的社区雨后春笋般的出现,这一切都预示着Linux将在教育领域,在工业领域在政治领域将得前所未有的成功。
Linux 操作系统的技术特点
Linux系统吸收了Unix操作系统的精华思想——“简单就是美”,因此它采用了紧缩内核结构,只在内核中实现那些必要的功能,尽量保持内核精悍短小。至于那些丰富多彩的附加功能统统交给用户空间的库函数或其它系统软件或应用软件完成。
有时大家将直接将Linux内核和 Linux操作系统化等号,这也没错的。而我们上文提到的操作操作系统多数情况不仅仅只内核而且还只内核之上的系统程序,可以说是广义的操作系统概念,希望大家区别。
为了能受益于Unix系统的影响力,Linux采用了Unix的系统调用接口标准POXIS.1,保证了和Unix系统的有限兼容,从而抓住了很大一部分Unix技术人员。
另外Linux起源于小型计、通用算机,并非针对大型和专用计算机设计,因此结构复杂性和规范性都比较适中。
还有就是目前多数Linux操作系统版本都是以服务器为出发点,因此网络功能和系管理能力突出,多数应用也是专为网络管理服务的,对于个人用户所关注的桌面应用和嵌入应用关注的实时性支持尚且有限(今年Linux发展的一个重要议题就是针对桌面和嵌入开发相应的内核版本)。
Linux 内核的特点
Linux是一种是实用性很强的现代操作系统,开发它的中坚力量是软件工程师,因此多以实用性和效率为出发点,很多地方还考虑了工业规范和兼容性等因素,因此不同于教学性操作系统追求理论上的最先进性,Linux系统内核最注重的问题是实用和效率。
下面我们简要归纳一下Linux内核的特色。
第一,Linux内核被设计成单巨内核(monolithic?)结构(相对微内核而言,微内核是一种功能更贴近硬件的核心软件,它一般仅仅包括初等内存管理、同步原语、程间通讯机制、I/O操作和中断管理,这样做有利于扩展性和移植性。但是微内核与诸如文件管理、设备驱动、虚拟内存管理、进程管理等其它上层模块之间需要有较高的通讯开销,所以目前多集中在理论教学领域,对工业应用效率难以保证。),因此效率高,紧凑性强。
第二, 2.6版本前Linux内核是单线程结构——所谓但线程结构是说同一时间只有一个执行线程(内核中的执行程序)允许在内核中运行,不会被调度程序打断运行其它任务,这种内核被成为非抢占的,它的好处在于内核中没有并发任务(单处理器而言),因此避免了许多复杂的同步问题,但其不利影响是非抢占特性延迟了系统响应速度,新任务必须等待当前任务在内核执行退出才能获得运行机会。工业控制领域需要高响应速度,因此2.6版本后由于Robert love等人的贡献,将抢占技术引入了Linux内核,使得其变为内核抢占系统,当然付出的代价是同步操作进一步复杂化了。
第三,为了保证能方便地支持新设备、新功能,又不会无限扩大内核规模,Linux系统对设备驱动或新文件系统等采用了模块化方式,用户在需要时可以现场动态加载,使用完毕可以动态卸载。同时对内核,用户也可以定制,选择适合自己的功能,将不需要的部分剔除出内核。这两种技术都保证了内核的紧凑性和扩展性。
第四,Linux内核纯粹是一种被动调用服务对象,所谓被动是因为它为用户服务的唯一方式是用户通过系统调用来请求在内核空间运行某个函数。内核本身是一种函数和数据结构的集合,不存在运行的内核进程为用户服务(虽然Linux的确存在一种被称为内核线程的进程,但它并不是用来服务于用户的,仅仅作为系统自身的服务目的)。
第五, Linux内核的采用虚拟内存技术使得内存空间虚拟扩展到了4GB之多,其中0-3G属于用户空间,称为用户段,3G-4G属于用户空间,称为内核段。这样使得用户编写程序可以使用远远大于实际内存的存储空间。
第六, Linux的文件系统最大特点是实现了一种抽象文件模型——VFS(虚拟文件系统),该文件系统属于Unix风格。使用虚拟文件系统屏蔽了各种不同文件系统的内在差别,使得用户可以使用同样的方式访问各种不同格式的文件系统,可以毫无区别地在不同介质不同格式的文件系统之间使用VFS提供的统一接口交换数据。这种抽象为Linux带来了无限活力。
第七, Linux提供了一套很有效的延迟执行机制——下半部分,软中断,tasklet和2.6新引入的工作列队等,这些技术保证了系统可以针对任务的轻重缓急,更细粒度的选择执行时机。保证了系统运行时尽量在安全时间(不关中断)。
Linux除了以上提到的特色外,还有许多其它突出特点,我们将在以后各期的介绍中有序地介绍。如果对上述特色有疑问的话,请别着急,后面的学习将为你解答。
Linux 操作系统内核结构
Linux内核虽然实现和Unix系统有很大不同,但是其结构还基本保持和Unix雷同,其中功能也和我们前面提到的操作系统内核要求大体一致。
请见下图
下面我们简要说明一下个模块之间的联系。
用户空间的任何程序如果需要使用内核提供的服务,都必须经过系统调用,因此系统调用层和内核中大多数模块都留有接口,它们或是用来控制系统服务属性(如sys_fnctl设置文件操作属性;sys_nice设置进程时间片),或是从内核提取数据(如sys_time获得由时间中断维护的系统计时),或请求内核分配资源(brk扩展进程堆内存)。
文件系统包含VFS和各种实际文件系统。VFS为实际文件系统抽象了统一接口,而实际文件系统提供自身具体实例操作方法。另外在Linux中和Unix一样设备被巧妙的归属为特殊文件,受文件系统抽象和管理,因此其操作方式和文件系统一致。文件系统将对设备的操作递交给实际的设备驱动处理。
Linux中设备管理将设备被区分为块设备——可以随机访问,如磁盘——和字符设备——只能顺序访问,如键盘。字符设备结构简单,文件系统可将请求直接提交给字符设备驱动处理,但是对于块设备,由于频繁的随机访问需要反复进行磁盘寻址操作,这样会对系统载核的带来沉重负担,因此内核对块设备的请求必须加以整合,比如对请求排队、合并、然后有选择地派发给物理设备;另外读取设备时还需要在内存中进行缓冲磁盘块。因此在请求被提交给块设备前必须经过I/O层处理进行预处理,在磁盘块被读取后必须由I/O层进行块缓冲处理。
中断管理系统负责为设备服务,它相比轮询等方式节约了CPU周期,另外时钟中断还要负责更新系统时间,触发进程调度。
内存是系统中的核心资源之一,是数据存储和传递的必被条件,因此管理系统不但系统调用需要使用,而且几乎系统中所有模块都多多少少地需要使用内存管理系统的函数。文件系统、I/O系统用来缓冲数据都需要分配内存,进程管理中的进程数据存储,地址影射都需要内存,堆的增长也需要动态请求内存;还有就是进程通讯中的一个有效方法就是利用共享内存来实现的。
进程管理除了和内存管理和进程通讯有关外,也和文件系统有重要关联,因为进程资源中文件毫无疑问属于最重要的部分之一,因此进程管理系统也必须和文件系统交互。
其中个个模块不是孤立的,而是联系万千,对于其中奥秘,希望读者仔细咀嚼。
http://blog.csdn.net/images/blog_csdn_net/jdmba/110399/r_photo3.jpg
中断管理
块设备
字符设备
设备驱动
Ext2
VFS
jfs
vfat
I/O层
系统调用
内存管理
进程管理
进程间通讯
外设备
内存
CPU
Linux 操作系统的文件构成
内核虽说是Linux操作系统的精华所在,是其它程序赖以运行的基础,但是如果一个实用的操作系统仅仅只有内核,而在其上没有丰富、强大的系统程序和应用程序供用户使用,就好比大厦建好了,也通了电,但却没有电梯、电话和办公设备,用户仍然无法入住使用。因此Linux操作系统的发行版除了带有内核以外,还带有大量的系统程序和应用程序,比如最新红帽子系统的发行版本句需要2-3张光盘,其中绝大部分是应用程序。
要想深入学习linux内核,首先需要能熟练使用Linux操作系统,了解整个系统文件构成——正所谓,刨丁解牛,始见无非全牛者——由外至内的学习Linux,再从内向外推敲;从感性深入理性,再由理性返回感性,才会获得最深刻的认识。内核的众多特点最终还是要反映到用户应用上的,所以先熟悉应用无疑会对内核学习有很大裨益。而且学习内核结构的一个重要目的就是推动我们更有效的使用Linux操作系统,无论是从系统管理角度来说或是从程序开发角度上说,掌握内核级别的系统调用、资源分配、中断控制或进程调度等技术都是不凡的价值,可以帮助你有效开发和驾驭系统。
这节我们先在这里简要介绍一下Linux系统的文件构成,将Linux操作系统的外在全貌展现给大家。我们在系统启动后,进入系统所能观察到的就是一系列目录(使用ls或dir)
,认识这些目录构成是学习使用Linux系统的第一步,下面我们就罗列出主要目录并简要描述各自内容。
Linux系统根目录/下包含包含:
bin:该目录存放最常用的基本命令,比如拷贝命令cp、编辑命令vi、删除命令rm等。
boot:该目录包含了系统启动需要的配置文件、内核(vmliuxz)和系统镜像(initrd….img)等。
dev:该目录下存放的是Linux中使用或未使用的外部设备文件(fd代表软盘,hd代表硬盘等),使用这些设备文件可以用操作文件的方式操作设备。
etc:该目录下包含了所有系统服务和系统管理使用的配置文件;比如系统日志服务的配置文件syslog.conf,系统用户密码文件passwd等
home:该目录下包含了除系统管理员外的所有用户的主目录,用户主目录一般以用户登陆帐号命名。
Lib:该目录下包含了系统使用的动态连接库(*.so)和内核模块(在modules下)。
host+found:该目录包含了磁盘扫描检测到的文件碎片,如果你非法关机,那么下次启动时系统会进行磁盘扫描,将损坏的碎片存到该目录下。
mnt:该目录下包含用户动态挂载的文件系统。如果要使用光盘,U盘都一般应该将它们安装到该目录下的特定位置。
proc:该目录属于内存影射的一个虚拟目录,其中包含了许多系统现场数据,比如进程序数,中断情况,cpu信息等等,它其中的信息都是动态生成的,不在磁盘中存储。
root:该目录是系统管理员(root用户)的主目录。
sbin:该目录下包含系统管理员使用的系统管理命令,比如防火墙设置命令iptable,系统停机命令halt等
tmp:该目录下包含一些临时文件。
usr:该目录下一般来说包含系统发布时自带的程序(但具体放什么东西,并没有明确的要求),其中最值得说明的有三个子目录
/usr/src :Linux内核源代码就存在这个目录
/usr/man :Linux中命令的帮助文件
/usr/local : 新安装的应用软件一般默认在该目录下
var:该目录中存放着在不断扩充着的信息,比如日志文件。
以上就是Linux文件系统的原始构成,熟悉它们是应用Linux操作系统的前提,希望大家亲自打开各目录看看。
搭建Linux试验系统实例
进入后续章节讨论的内核前,我们先与读者一同从头构架一个试验操作系统。这样既有助大家熟悉Linux操作系统的组成结构,也会在构建过程中学习介绍一些Linux命令和使用技巧,加深理解Linux操作系统的运作方式。
实验系统将在保证实用价值的基础上,尽量小巧。希望大家通过亲手构建系统的过程中,能消除对Linux的恐惧感,更希望读者自己能使用裁减的系统,给自己带来成就感和学习热情。
必备的基础知识
对于第一次接触Linux的朋友,仅仅看下面的内容显然不能指望学会Linux的操作方法和系统行为,建议你去找本系统一点的Linux系统教程慢慢咀嚼吧。对于像系统管理员这种大牛,跳过下面内容吧,再高的就去看看新浪体育新闻什么的,别在这瞎转了J。
搭建系统过程中将离不开敲击各种各样的命令,离不开执行大大小小的shell脚本。而最整个过程中重要的是理解系统的运行思路,一切活动的指导思想都要围绕系统运行的步伐,要“顺从“系统运行自己和系统运行服务这一指导思想。所以基础知识也从这几个角度展开。 不过我们蜻蜓点水,不做深究。
基本命令我们首先介绍一组搭建Linux系统需要使用的基本的命令。当登陆到Linux系统上后,出现在我们面前的是一个shell 提示符(# 或 $等),该提示符号告诉我们系统已经准备接受命令了,你可以用键盘输入命令行来操作系统了,你输入的命令将在屏幕上显示出来,并议回车键表述命令输入结束、发送命令给系统的标志
Shell和SHELL编程
Shell是什么?
在你登陆到系统后,系统首先运行的是一个特别的应用程序,它显示一个提示符号表明系统已经准备好开始接受你的命令了,当你键入你要执行的命令后,该应用程序将命令提交给Linux系统去处理,然后等处理完毕再把结果返回给你,这之后她又将回到提示状态,去等待你下次输入命令。这个特殊的“接待”程序就被称为shell,其作用相当是一个内核与用户交流的界面,她周而复始地向内核解释用户命令,因此Shell又被称称为命令解释器。
SHELL作为一种应用程序并非只有唯一一种,目前流行的shell有sh / bash /ksh /tcsh/csh等等,他们其实也就始一个应用程序,你可以使用命令whereis ksh/sh/bash来查看其存在于系统中的具体位置。
有兴趣得话,你可以通过命令 echo $SHELL来观察系统默认的SHELL属于那一种。你也可以在登陆后(使用Ctrl+D可以重新登陆)使用chsh来改变选择使用的shell程序,或干脆直接在默认shell上执行新的shell程序——只要键入新shell名字并回车即可,如果想推出新shell,就再执行exit程序。