Google将数十亿行代码储存在单一的源码库

时间:2021-01-26 19:39:39

过去16年,Google使用一个中心化源码控制系统去管理一个日益庞大的单一共享源码库。它的代码库包含了约10亿个文件(有重复文件和分支)和 3500万行注解,86TB数据,900万唯一源文件中含有大约20亿行代码。2014年,Google的2.5万名程序员每周修改25万个文件中的 1500万行代码(日均120行)。相比之下,Linux内核源码库有4万文件和1500万行代码。

Google的程序员每个工作日递交1.6万次commits(64%的人),还有 2.4万commits是自动系统完成的。代码库每天响应了数十亿次文件读取请求,高峰时每秒需要执行80万次查询,工作日平均每秒需要执行50万次查询。

在2012年10月前,这个库只支持Linux,之后加入了Windows和Mac支持。2012年前人类递交的commits占多数,但之后 Google切换到了定制的源码控制实现,自动的 commits开始增加。《ACM通讯》刊登了一篇文章描述了Google为什么将数十亿行代码储存在单一的源码库