我如何配置自己的第一个深度学习+数据科学工作站?

时间:2024-05-31 11:11:58

全文共4129字,预计学习时长11分钟

 

我如何配置自己的第一个深度学习+数据科学工作站?

图源:unsplash

配置自己的工作站是我一直以来梦寐以求的事情。我倒是知道该如何配置,但却迟迟没有尝试,无非是因为没钱或没时间,主要是没钱。

 

但终于到了事在必行的时刻了。我受够了在亚马逊云服务(AWS)上为小型个人项目设置服务器,进行繁琐的安装操作,又或是不得不使用对运行时间和网络连接有诸多限制的Google Collab notebooks。因此,在英伟达显卡(NVIDIA)客服的帮助下,我花了点时间构建了一个深度学习装置。

 

整个过程包括仔细阅读不少相关材料,并在Youtube上观看大量莱纳斯科技贴士(LinusTech Tips)的视频。这是我第一次从头组装电脑,算是种特别体验。按照需求配备DL(深度学习)装置需要进行大量研究。我对各个部分进行了研究,涉及性能、评价,甚至美学。

 

目前,我研究的大多数工作站配置都是为了打游戏,所以我决定制定一个《深度学习装置准则》。我将在其中提及所有使用过的组件以及使用这些特定部分的原因。

 

如果觉得自己组装过于昂贵和复杂,Exxact提供了一系列不错的深度学习工作站和服务器,起价5899美元,带有英特尔酷睿(Intel Core)i9芯片,多个英伟达 RTX 2080 Ti 绘图处理器(GPU),3年保修期和深度学习软件栈。

 

此外,如果想了解在应用Ubuntu 18.04为操作系统后应如何设置深度学习库,可以查看深度学习工作站设置权威指南:https://towardsdatascience.com/a-definitive-guide-for-setting-up-a-deep-learning-workstation-with-ubuntu-18-04-5459d70e19c3。

我如何配置自己的第一个深度学习+数据科学工作站?

 

为何依旧需要工作站?

 

我脑海中浮现的第一个答案是:为什么不需要?

 

我在深度学习及机器改进应用程序上耗费了很多精力,每开始一个新项目,都要构建一个新服务器并安装所有相关组件,这一直是个大难题。更何况,它外型美观,可以随时在桌面上打开使用,还能根据你的要求进行个性化配置。再加上使用GCP或AWS所带来的成本问题,我很赞同自己配备装置。

我如何配置自己的第一个深度学习+数据科学工作站?

我的家用设备

我如何配置自己的第一个深度学习+数据科学工作站?

 

我的配置

 

我花了几周的时间完成最终配置。

 

从一开始,我就明确了这需要强大的运算能力,还得在未来几年内对其进行升级。目前,我的首要任务是获得支持NVLink的英伟达 RTX 泰坦(Titan)双卡系统。这样我就可以拥有48GB的GPU内存,这太棒了!

 

以下配置可能不是最好的,也可能存在更便宜的替代方案,但毋庸置疑,它能让你以后更省心,所以我照做了。我联系了英伟达公司,得到了不少有关这个特殊配置的建议,在得到肯定后才开始后续步骤。

 

1.英特尔i9 9920x 3.5 GHz(千兆赫)12核处理器

我如何配置自己的第一个深度学习+数据科学工作站?

英特尔还是超微半导体(AMD, Advanced Micro Devices)?

没错,我放弃了超微半导体处理器,使用了英特尔处理器。尽管人们对此有不同看法,但我有这么做的原因。英特尔的软件更兼容也更有关联性,如英特尔MKL,对于我使用的大多数Python库来说,这很有帮助。

 

且至少对我来说,另一个更重要的原因是,如果我想拥有一个双重RTX泰坦配置,英伟达员工建议我使用i9,这在以后会减少很多麻烦。

 

为什么在英特尔系列里选择了这个?一开始,我使用10核的9820X和18核的 9980XE,但后者大大增加了我的预算。我发现配有12核和3.5 GHz处理器的i9–9920X恰好符合预算,而且中档解决方案总不会错,因此我选择了它。

 

现在,CPU(*处理器)成为了一个组件,它决定最终使用的其余组件。例如,如果选择i9 9900X系列的CPU,就需搭配X299的主板,或者如果打算使用超微半导体公司线程撕裂者(Threadripper)CPU,将需要一个X399主板。所以要注意选择正确的CPU和主板。

 

2.微星(MSI) X299 SLI PLUS ATX LGA2066主板

我如何配置自己的第一个深度学习+数据科学工作站?

 

选择太繁多了,让人无法抉择。我想要一个能够支持至少96GB内存(RAM)的主板(按照英伟达公司的规格,支持双泰坦RTX GPU)。这意味着,如果选取16GB的内存条,就最少要有6个插槽,因为16x6=96。这个主板有8个插槽,所以它的内存可以扩展为128GB。

 

我还希望之后能拥有配备2TB NVMe 固态硬盘(SSD)的系统,这意味着这块主板的双M.2端口刚好符合需求,否则我将不得不购买昂贵的2TB单NVMe固态硬盘。

 

我考虑了ATX外形尺寸因素,4个PCI-E x16显卡插槽,以及合理的价格,最终选定了这个主板。

 

3.猫头鹰(Noctua)NH-D15 chromax.黑色82.52 CFM CPU冷却器

我如何配置自己的第一个深度学习+数据科学工作站?

 

我如何配置自己的第一个深度学习+数据科学工作站?

气流怪物

如今很流行液体冷却。一开始,我也想要一体式(AIO)冷却器,也就是液体冷却器。

 

但与英伟达的客服交谈完,并在互联网论坛上浏览了两种选择的利弊后,我发现空气冷却更符合我的需求。所以我选择了市场上最好的空气冷却器之一——猫头鹰NH-D15,而不是质量一般的水冷散热器,它还是一个静音冷却器。

 

4.追风者(Phanteks) Enthoo Pro钢化玻璃机箱

我如何配置自己的第一个深度学习+数据科学工作站?

 

我如何配置自己的第一个深度学习+数据科学工作站?

完美容纳所有组件

接下来就要考虑机箱的容量,要能够装下所有组件,并提供所需的散热功能。我花了大量时间对此进行研究。

 

我们用到了2个泰坦RTX显卡,9920x的*处理器和128G的内存。这会造成严重的机箱过热。此外,猫头鹰空气冷却器对所占空间有要求,还需要容纳更多风扇。由于我审美品位奇特,加上要符合国家使用规范,我只有两种选择,分别是海盗船(Corsair)Air 540和追风者Enthoo Pro钢化玻璃PH-ES614PTG_SWT。

 

两者的质量都很好,但我选择了Enthoo Pro,因为它款式更新,并且有更大的全塔机箱,为未来实现更多个性化构建创造了可能。

 

5.带有3槽规格NVLink桥接器的双泰坦RTX

我如何配置自己的第一个深度学习+数据科学工作站?

“菜谱”主要原料

目前为止,这个双泰坦RTX是整个配置中最为重要和昂贵的部分。单单它们就占了成本的80%,但这超值。

 

我想在自用配置中拥有高性能GPU,英伟达的客服非常慷慨地给了我其中两个进行测试。

 

我就是喜欢它们的设计。不止是它们配置的外观,还有它们可以结合3插槽NVLink来有效提供48GB的GPU内存。如果预算不足,也可以退而求其次,选择2代英伟达精视(GeForce)RTX 2080 Ti。

 

但有一点不足之处,RTX2080Ti可能需要更小批量的规模训练,而且在某些情况下,由于RTX2080Ti的内存只有11GB,可能无法训练大型模型。另外,你不能在RTX2080Ti上使用NVLink,而NVLink则结合了泰坦多GPU的视讯随机存取记忆体(VRAM)。

 

6.三星970Evo Plus 1 TB NVME固态硬盘

我如何配置自己的第一个深度学习+数据科学工作站?

 

存储器选什么呢?当然是NVMe固态硬盘。其中的三星Evo Plus无疑是本次固态硬盘竞赛中认可度最高的赢家。

 

我购入了一个,目前正在使用。不过,因为我的主板上有2个M.2端口,之后将一共会有2TB的固态硬盘总存储量。还可以购买其他2.5的固态硬盘来获得更多存储空间。

 

7.海盗船复仇(Corsair Vengeance)LPX 128GB (8x16GB) DDR4 3200MHz

我如何配置自己的第一个深度学习+数据科学工作站?

 

我的第一台计算机只有4MB的内存,我从未想过拥有一台128GB内存的电脑。按照英伟达团队的建议,我至少需要96GB的内存,所以不如直接配齐128GB内存。

 

可以看出,这些内存条并没有红绿蓝(RGB)灯,这是因为猫头鹰空气冷却器没有为内存插槽留出太多的空隙,而带有RGB灯效的内存条却高度略高,占空间较大,要注意这一点。此外,由于我在配置时更关注泰坦GPU的显示效果,我从未想过去配备RGB内存条。

 

8.海盗船1200W电源

我如何配置自己的第一个深度学习+数据科学工作站?

1200W的电源相当大,但须注意全功率情况下我们的组件预计需要大约965W。

其他厂家也提供了别的电源选择,但我选择了海盗船,我喜欢它的名字。我本来想选HX1200i,但它不适配,而AX1200i比我选的这个要贵得多。除了我最后选中的HX1200之外,这两者也都是很好的选择。

 

9.更多风扇

我如何配置自己的第一个深度学习+数据科学工作站?

静音散热系统

追风者机箱配备了三个风扇,但建议将机箱的通风口和排气扇升级为BeQuiet BL071脉宽调变(PWM)风扇,因为双泰坦发热量很大。我注意到由于机器常常开着,室内温度比室外温度高出近2-3度。

 

为了达到最好的通风效果,我购入了5个风扇。我在机箱顶部放了两个,就放在追风者机箱风扇旁边。又在机箱前侧放了两个,剩下的一个放在后侧。

 

10.外围设备

我如何配置自己的第一个深度学习+数据科学工作站?

音箱配茶,不可或缺

这部分不是非弄不可,但我还是希望做事做全套。

 

已经花了那么多心血,我不想在外设上随便应付。所以我购入了用于内容创作的LG27UK6504k显示器,用来玩会儿游戏的明基(BenQ)EX2780Q1440p 144hz游戏显示器,还有机械樱桃(Mechanical Cherry)MX红色海盗船K68键盘和海盗船M65专业鼠标。

 

配置完成!

我如何配置自己的第一个深度学习+数据科学工作站?

 

定价

 

由于组件从不同的国家和来源购入,我将按照PCPartPicker网站的价格进行定价。你可以在PCPartPicke网站上查看零件清单:https://pcpartpicker.com/list/zLVjZf。

我如何配置自己的第一个深度学习+数据科学工作站?

 

如你所见,即使从英伟达获得了GPU,这也还是很昂贵,但这就是为避免一些痛苦所必须付出的代价。

 

这就是我配备深度学习装置所需的所有部分以及选择的原因。你或许在寻找更好的组件或不同的设计,但对笔者来说,这个组件已经运行得足够出色了,速度也很快。值得一试!

我如何配置自己的第一个深度学习+数据科学工作站?

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

我如何配置自己的第一个深度学习+数据科学工作站?

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)