用户操作系统Unix的前世今生

时间:2022-05-28 19:54:11

【前言】

Brain Kernighan,加拿大计算机科学家,曾就职于贝尔实验室,目前为普林斯顿大学教授。他曾参与 Unix 的研发,也是 AMPL 与 AWK 的共同创造者之一,他和 Dennis Ritchie 共同写作了C语言的第一本著作《C程序设计语言》,他是大名鼎鼎的 K & R 里面的 K,当然也是 AWK 里面的 K 。作为 Unix 的开发者之一、Unix 命名者,亲眼见证了 Unix 的诞生。 关于 Kernighan,还有一个有趣的定律——柯林汉定律。

柯林汉定律:调试一段代码的难度是编写它们的两倍,因此如果你的代码写的尽可能巧妙,按照定义而言,你可能没有能力来调试它了。

关于 Unix ,除了 Kernighan,有三个人的名字需要记住:美国计算机科学学者和工程师、B语言发明人 Ken Thompson,美国计算机科学家C语言的创造者、Unix操作系统的关键开发者Dennis Ritchie 以及 达特茅斯学院的兼职教授、著名数学家、工程师以及程序员 Doug Mcllory。 Unix 的诞生地贝尔实验室真的是大神云集,自己好几天才能做出来的东西别人可能一顿饭工夫就能解决。这种*的环境令人不禁想起来著名物理学家费恩曼介绍自己在 Caltech 的有趣故事。在 Unix 的诞生之路上,有哪些人和事给 Kernighan 留下了深刻印象呢?

在贝尔实验室的第一天就遇到了 Richard Hamming !

1967 年,当 Kernighan 还是一个研究生的时候,就拿到了贝尔实验室的实习,贝尔实验室可真大,三千多人在此工作,Kernighan 虽然是实习生,也配置了独立办公室,让我等打工人羡慕不已。令人更酸的是,Kernighan 后来去贝尔实验室都没有面试,只要完成博士论文就可以了。和我们一样,快到中午的时候,也会思考“我中午要吃点什么才好呢?。就像电视剧当中的剧情一样,真的就有一位绅士来邀请共进午餐。他介绍说自己是 Dick(英文名 Richard 的简写和昵称),Kernighan 当时也没有记住他的名字,只能偷偷去他的办公室看门口的牌牌,他就是 Richard Hamming!

Hamming 的英文*页面特别的长,随便哪个都是碾压级别的:参与曼哈顿计划为核武器发射编写程序、图灵奖得主、纠错码发明人,为了表彰他的贡献,IEEE 还特意设立以他的名字命名的奖项。和费恩曼一样,Hamming 在实验室里面也不喜欢当团队的领导者。

将 Kernighan 对于 Hamming 的描述概括起来就是两个字——伟大。这可不是高帽,Hamming 真的是这样要求自己的,这个天赋异丙而又有趣的人,在很多方面对世界做出了深刻的影响。Hamming 说过,他会把周五的下午用来思考伟大的事情。他还会去找其他方向的人聊天,发出灵魂拷问:“你的研究是否有可能获得诺贝尔奖?”如果得到否定回答的话,就会化身教鞭“那你为什么要做?这个研究连获得诺贝尔奖的可能都没有,肯定没那么重要了,你为什么要把时间浪费在不重要的事情上呢?”退休几年之后,他还发表了关于如何获得成功职业生涯建议的演讲,题目为《你和你的研究》。

Fortran 那么难

话题说回 Kernighan,他听从了 Hamming 的建议,论文研究的课题是图分割,这个跟著名的旅行商问题比较像。不过他还得用普林斯顿的电脑,要知道,1967年的电脑跟今天的可大不一样,和段子里面中用针刻光盘类似,那时候的程序员编程还是喜欢用打孔卡,比如 Fortran 和 Combol 语言。Fortran 是用于科学计算的编程语言,现在也有很多科学家的课题组或者专业软件在使用Fortran语言编程。

Kernighan 其实也是个有趣的家伙,有一次他们参与了一条广告的拍摄,他反常地打了一条领带,结果几周后对方表示照片丢失了,需要再拍一张,结果 Kernighan 坚决表示不打领带拍摄,后来发现刊登的还是打领带的照片,因为那张照片居然被他们找到了。

现在连小学生都会玩电脑和平板,但是大部分见到软盘的话应该会当成“保存按钮”,就更不用说古老的打孔卡了。感兴趣的朋友可以搜索一下关于打孔卡的历史。编写一个程序真的太费功夫了。做好的打孔卡装在盒子里面,去计算机房,计算机操作人员给你们处理,你就只能等结果,而且可不会给你显示什么报错,就算这样,在那个时候真的是足够快、且昂贵了。

【关于打孔卡】19世纪80年代,美国人口调查局职员发明了用于人口普查的穿孔卡片和机器,用于90年的人口普查,用了六周就完成了之前需要7年的工程。何乐礼创建的公司发展成了今天的 IBM ,1928 年(算到这边就是民国十七年),IBM 发现矩形孔更省空间,发明了 80 列的矩阵孔卡片。它的设计是这样的,最下面的 10 行命名为 0-9 行,顶部两行为 11、12 行,每列的孔代表一个字符,一些特殊的字符用了额外的单孔双孔表示。 后来 IBM 又对打孔卡进行了一系列的改进。

用户操作系统Unix的前世今生

80 孔打孔卡

分时系统和 Multics 的诞生

在 Unix 分时系统出现之前,人工和机器的交互简直就像《疯狂动物城》里面的树懒一样,慢是真慢,而且毫无交互体验,和现在相同的是,提交者都不希望有 bug 出现,即使多提交几张打孔卡的代码也无妨。

Kernighan 讲到,他注意到 Jerry Saltzer写的给博士论文排版的程序,自己也写了一个代码来给自己的论文进行排版。但是 Fortran 对于字符的处理实在是不太好,以至于最后论文居然有 3 盒打孔卡,每盒 5000 张,大概 5 公斤那么重,其中 1000 张是程序代码,等了两三个小时之后才打出来这份论文。

贝尔实验室的 Ken Thompson 和 Dennis Ritchie 开始了一个新的项目——Multics。这是个分时操作系统,在交互式方面有着重要的突破。它允许多人连接到计算机上,每个人都可以获得一部分时间,给用户一个独占整个计算机的感觉,不过计算机实际上还会在他们之间来回切换。如果你可以“独享”的话,你就可以使用电传打字机而不需要打孔卡了。电传打字机这个东西是打字机、打印机和电话线的结合体,你可以输入命令,通过电话线传给计算机,然后输出。这种原理和现在的 SSH 其实比较类似,

打孔卡的环境其实叫做批处理环境,这个提交脚本作业、Windows 当中的 bat 比较像,如果代码完正确的话,其实效率还是挺高的,就比如我们现在利用超算提交作业,往往就是用的批处理脚本,例如著名的竞赛网站 Kaggle 平台就会分别提供 Notebook 交互环境和 Scripts 的模式。有了分时系统,用户就可以进行及时的人机交互,对于较小的不成熟的作业就能够及时获得反馈。

了不起的 Ken Thompson

不过,Multics 实在是太贵了,尽管它能提供很好的计算环境,很多针对它的描述用到了”过度工程“这个词。 因此,贝尔实验室在 1969 年退出了项目,只有 MIT 和 AT&T 还在支持。虽然贝尔实验室退出了 Multics计划,Ken 可没闲着,实验室有一台 PDP-7,说是一台微型机,实际上也是需要一件屋子才能放得下,不过还好已经有显示器了。他就用这台 PDP-7 机器,把自己写的《Space Travel》 游戏在上面运行了。游戏当中玩家可以互相射击,而且还加入了引力效果,让玩家对轨道动力学有了简单了解。

总是有那么多巧合,Ken 的爱人带着一岁的孩子去加州呆了三周度假。利用这三周的时间,Ken 完成了可以正常运行的系统,他命名为“Uniplexed Information and Computing System”,缩写为 UNICS ,这可以说是 Unix 的初代机了。

对于文档处理软件,Ken 也很感兴趣,为了论文格式之类的问题,他们买了一台排字机,这个东西有点像现在的激光打印机,打印到感光纸上,然后洗成照片。不过机器本身的软件很容易出错,两人商量了决定逆向一下这个软件,设计自己的软件来运行。一台机器、使用手册,汇编语言的代码,这就是他们目前手头上有的东西。Kernighan 想着太难了还是先吃个晚饭,等他回来的时候,Ken 已经写出了反汇编程序看到裸机当中代码了,第二天他甚至还用 B 语言写了一个解释器。Kernighan 表示说这些事情你我都可以完成,但绝对不是几个小时就能搞定的。对 Ken 来说简直就是砍瓜切菜,手到擒来。

文件系统、shell 和管道

早期的计算机,例如 IBM,实际上没有什么文件系统,虽然存储信息的方式比较多,但是都比较局限于特定设备和场景,但访问辅助存储的信息是,你就得记住注入光盘柱面等等奇怪的属性。而 Ken 在 Unix 当中就实现了更加简单整洁的文件系统。只要 6 个系统调用就能获得处理信息需要的所有东西。

关于 Unix 另外一个伟大的点在于交互式 shell,也就是我们喜欢的命令行。这个想法最初在 Multics 上就有体现,只是 Unix 上更加清晰。早期的管道概念也是在这里萌生的,你不用经过中间件,就能将程序的输出放到另一个的输入当中,大概 1973 年,Doug Mcllory 希望把程序接在一起,就像花园里面的水管连接起来一样,后来反复提及,他想到了用竖线,也就是我们今天的管道符号。Ken 也将管道符号添加到了 Unix 系统。这个有点像函数式编程,Unix 程序似乎一下子变成了积木,有了拼接的可能。

Unix 文化

Unix 系统后来被移植到了 PDP-11 上面,放置这台机器的地方在贝尔实验室的 6 层,这就是 Unix 房间,房间很大,但是走廊光线很差,还有些二战时期的垃圾设备。不过房间本身不错,就像现在开放式环境一样,大家可以闲聊,虽然有点嘈杂,毕竟大家的工作一致,有时候很容易得到启发。

你可以在办公室里面思考程序,也可以写在黑板上,需要的时候在放回公共区域,有些人就喜欢一直在公共区域里。比如 Ken,他从来不在自己的办公室里面,Kernighan 就喜欢在办公室里面,然和每隔一两个小时就去冲个咖啡,和别人交流一下。整栋大楼的人都很愿意和别人交流,楼里面的走廊里面贴着很多东西。计算机方向的人在两个小走廊直接办公,他们很愿意来回走动。不过 Unix 房间某个时期在走廊的一端,后来又到了六楼,空间非常紧凑,不过这种布局也更方便了大家交谈。这种友善的环境当中,经常能发现一些有趣的东西。

据 Kernighan 讲,当时他们还搬来了 10kg 的巧克力,人们用刀切一两块带走,搞得满地都是渣渣,估计负责清洁的人都要炸了。有时候你走进 Unix 房间,走到旁边的屋子里面,听到人们会讨论 Unix 多么强大或者给别人介绍我们做的其他东西,有时候还会有一些名人到访。整个氛围轻松愉快。Ritchie 经常会把他姐姐送给他的英国讽刺刊物《私家侦探》放在桌子上,一般就在巧克力旁边,我有时候也会翻一下看看里面有趣的卡通画,不过有些东西真的是英式幽默,没有在英国生活过可能无法理解。

给 CIA 演示

Unix 的强大引来参观者无数,70年代中后期,Kernighan 他们就要给许多名人展示 Unix 系统, 陪同人员还都是贝尔实验室的高层。不过最有意思的还是中情局局长,William Colby。

展示的内容主要基于 Unix 的组合思想,比如管道,多个程序组合就能比写一个专用程序容易得多。常见的展示就是拼写检查,可以把文档分割成单词,然后都变成小写,获得一片叫好。不过,由于当时的机器比较慢,知道 Colby 要来的时候,提前运行了管道,然后把结果存在文件里面当天直接打印,毕竟不能让大人物等三四十秒。这就是一个经典的“演示工程”。不过比今天很多"PPT 项目”已经好很多了。

如果对于程序谁有新的想法,也可以写一个新版本来改进,不过这里有个特别的规则,最后修改这拥有程序的所有权,Kernighan 后来成为了 ed 文本编辑器的所有者。这时候,其实计算机也是一个社区,只是你们看不到谁在线而已。那么还有个命令就是 who,不仅能看到谁在线,还能知道他最后做了什么。这种方式方便了信息共享和共同交流。

编程很难,如何变得简单?

我们今天用的一切,比如分享代码树、审查 PR 等等,其机制在四五十年前就出现了。后来 Unix 传到了贝尔实验室之外,包括源码,人们开始给 Unix 贡献代码,虽然这不是开源,但是和开源非常相似。

在 Kernighan 看来,今天的代码编写太难了,比起某个不知道多少层代码的文档中去找需要的函数,自己写程序逻辑这种创作的行为更加容易。Ken 的电子游戏或者类旅行商问题哪个更重要其实说不好,那么如何打造一个提升程序员工作效率的环境?如何让编程变得更加容易呢?如果做出了一些能对自己有帮助的事情,对他人的工作可能也会有所改善,何乐而不为呢?