深度学习装机指南:我们为普通青年和土豪准备了两套方案

深度学习装机指南:我们为普通青年和土豪准备了两套方案
2017年03月28日 15:00 量子位

深度学习,始于装机。

王新民 友情贡献

量子位 出品 | 公众号:QbitAI

研究深度学习该买一台什么样的电脑?我的笔记本能满足需求吗?

量子位请来小伙伴,为当前的深度学习网络训练提供了两套最新的装机方案。

第一套方案是预算为8000元的深度学习标准型台式机,这款台式机能够运行市面上几乎所有的大型游戏,完美全特效不掉帧,同时还可以顺便玩一下深度学习应用,例如奇特的风格融合。这套配置可以满足目前深度学习大部分的训练需求。

第二套方案是预算为20000左右的土豪版台式机,这款台式机为工作站主板,极其稳定,能够长时间开机稳定训练。

话不多说,直接上配置。

第一套·标准型
配件名品牌型号数量价格
机箱美商海盗船 400C 中塔侧透机箱1749 京东
主板华硕 Z170I PRO GAMING Mini-ITX主板11299 天猫
CPU英特尔 I7 7700K 酷睿第7代处理器11799 - 2799
内存美商海盗船 复仇者8G DDR4 24002798 京东
SSD三星850 EVO 250G M.2 固态硬盘1699 京东
机械硬盘西部数据 蓝盘 2TB 64M 台式机硬盘1499 京东
GPU七彩虹GTX1060 6G超频版游戏显卡11799 天猫
电源美商海盗船VS650 额定650w电源1399 京东
CPU风冷器乔思伯 HP625日食红 CPU散热器1159 京东
显示屏AOC I2279VW 21.5英寸显示器1699 天猫

总计:8200 - 9200元(不包括显示器)

第二套·土豪版
配件名品牌型号数量价格
机箱美商海盗船 600C 中塔侧透机箱1999 京东
主板华硕 /Asus X99-M WS/USB 3.1主板12599 天猫
CPU英特尔 I7 6800K 酷睿第7代处理器13399 天猫
内存美商海盗船 复仇者16G DDR4 300021878 京东
SSD三星960 EVO 500G M.2 NVMe SSD11799 京东
机械硬盘西部数据黑盘 2TB 64M台式机硬盘1999 京东
GPUNVIDIA TITAN X 12G Pascal(可替1080TI)19699 京东
电源美商海盗船 额定750W金牌电源1969 京东
CPU散热器美商海盗船H80i V2 CPU水冷散热器1759 京东
显示屏AOC I2279VW 21.5英寸显示器1699 天猫

总计:23100元(不包括显示器)

下面我们对这些配件分别进行分析:1. 机箱

机箱的选取需要考虑两个问题:

1. 主板、CPU散热器是否能够装得下;

2. 整体散热性和稳定性是否满足需求。

先说标准版配置,在进行入门研究只用一块显卡的情况下,散热不存在问题,推荐海盗船400C的中塔机箱,小巧稳定。

对于土豪版配置,由于采用了华硕的M款工作站主板,后期具有增加到两块显卡的可能性,适当地增大机箱的空间,建议选海盗船600C中塔机箱。

如果有上四路TITAN X的打算,那么需要选取散热条件更好、空间更大的机箱,可以用跟Nvidia DevBox同款的机箱,即Corsair Carbide Air 540,也可以是追风者PK515E或515ETG中塔机箱,个人觉得后者的颜值高一些,这两款都可以用来组装具有四路TITAN X的深度学习工作站。

2. 主板

主板的基本要求是稳定性足够好,具有较多的PCI-E Gen3 x16接口。

由于标准版配置只计划选用一块显卡,故选取了游戏级别的华硕 Z170I主板,该款主板只具有一个PCI-E Gen3 x16接口。

当按工作站要求来选择主板时,有两个指标:最好是X99平台和拥有较多的PCI-E Gen3 x16接口。华硕推出了两款工作站主板,分别是具有两路PCI-e 3.0 x16接口的Asus X99-M WS/USB 3.1工作站小板和具有四路PCI-e 3.0 x16接口的Asus X99-E WS/USB 3.1工作站大板。

所以,我们在第二套土豪版配置中采用了Asus X99-M WS/USB 3.1工作站小板,可以扩展到两路TITAN X或者是GTX 1080 TI。

具有四路TITAN X的Nvidia DevBox工作站用的是Asus X99-E WS主板,当有计划上四路TITAN X打算的话,主板可以选用Asus X99-E WS/USB 3.1工作站大板,避免由于后期扩展显卡但是主板存在局限性的问题。

3. CPU

选择CPU,主要是观察三个指标:主频,核心数和总线带宽。

在第一套标准配置中,由于是单机单卡,所以选择目前主频最高的I7-7700K。i7-7700k的散片价格为1799,质保一年;盒装价格为2799,质保三年。据销售称,这两者没有实质性的差异,可根据自身需求进行选择。

在单机多卡进行训练时,总线带宽是瓶颈,所以CPU的PCI-e lane越多越好,一般消费级的CPU,PCI-e总线根数是16, 28或40,最大就是40,进一步提升带宽就需要上服务器CPU或者双路至强CPU了。

有40带宽的这个条件下,有5款CPU入围,分别是:

i7-5930K(2014.3 3.5G 15mb 6核)

i7-5960X(2014.3 3.0G 20mb 8核)

i7-6850K(2016.2 3.6G 15mb 6核)

i7-6900K(2016.2 3.2G 20mb 8核)

i7-6950X(2016.2 3.0G 25mb10核)

还有一款为28带宽的CPU i7-6800K(2016.2 3.4G 15mb 6核)。

Nvidia官方推出的DevBox工作站所使用的CPU是i7-5930K,由于版本的更新,所以经过参数比较,第二套土豪级配置最多使用两块显卡,上手i7-6800K是比较合适的。

如果有上四块显卡的可能,建议使用上述所提到的5款总线带宽为40的CPU。

4. 内存

消费级的i7 CPU最大支持内存是128G。深度学习工作站内存选取技巧:内存大约为显存的两倍。

因此,我们在第一套标准版配置中使用了16G DDR4 3000的内存,在第二套土豪级配置中使用了32G的内存。内存的可扩展性很强,可以在使用中根据实际的占用情况来进行增减。

5. SSD

系统盘需要使用一块SSD,能够进行高速数据读取和存储。当前SATA III接口的SSD最普遍也最便宜,不过由于上述的两个主板都具有一个M.2接口,可以买一个M.2 NVMe的SSD,速度比SATA III接口也有所提升。

利用主板的这个接口,可以根据容量的需求来选择容量为256G或者是500G的SSD,例如三星960 EVO 500G M.2 NVMe SSD。

6. 机械硬盘

机械硬盘分为日常蓝盘(家用存储)、NAS红盘(网络数据存储)、企业金盘(密集读取型)、监控紫盘(存储密集型)、游戏黑盘(高端存储型)。

硬盘数据存储要求稳定,不存在数据丢失。

蓝盘为日常家用,最为通用;黑盘极其稳定,但是在运行过程中声音较大;红盘多用服务器数据存储,声音较小。故在第一套标准版配置中选择家用蓝盘即可,在第二套土豪级配置中最为高端稳定的黑盘作为存储盘,同时金盘也是不错的选择。

7. GPU

Tesla GPU性能很强劲,双精度计算能力非常优秀,适用于研究深度学习的超级计算机,但是Tesla K卡(K40,K80)十分昂贵,K40的价格为27000,K80的价格为37000。据一部分科研工作者反馈,对于网络计算的精度不需要达到这么高。

国内的公司和科研机构一般是使用一块Titan X Pascal,或者是两块GTX 1080,随着新品的面世,GTX1080 TI也是一个不错的选择。

GPU是计算的关键要素,利用台式机GPU来研究深度学习,就是通过足够的CUDA单元,以及配套的显存资源,来进行深度计算。尽管GPU也存在频率和显存带宽的差异,但是对于大部分的网络训练,6G及以上都是满足要求的。下图是对常用显卡的一个比较,可见如果是大量扩展时,1080TI和1070是比较合适的。

在标准版配置中,只能上一块GPU,建议显存大于等于6G,版本高于等于GTX 1060,即可满足日常实验研究,训练VGG网络或者Alexnet网络都不是问题。

上升到X99工作站主板后,最多可插两块Titan X或者四块 GTX 1080TI(当然仍然可以使用GTX 1080),上面选择的PCI-e总线为40的规定用于此处。

GTX1080 8G显存的价格是4100元左右;GTX 1080 TI显卡的价格是5700元左右,性能可以和Titan X相媲美,目前性价比最高;Titan X 12G显卡的价格是9700元,比较适用单次任务显存占用量高的网络,运行速度大约是GTX1080的1.6倍。

因此,我们在第二套土豪版配置中上了一块TITAN X,当然你也可以换成GTX 1080 TI,这也是不错的选择,根据实际训练情况再进行添置GPU。

特别需要注意的是,千万别买同级别的AMD卡!

NVida对深度学习计算的支持远远好于AMD,不然你会沉浸于无穷无尽的加速库安装和环境配置之中。

8. 电源

电源最高功率的计算可以通过鲁大师的功率计算功能得出,将得到的功率乘以1.4倍就是所需要购买的实际电源瓦数。

在第一种标准版配置中,实际功率大约为150+150+100=400w,保留充足的余量,选择海盗船VS650w的电源。

在第二种土豪版配置中,实际功率大约为250+150+100=500w,选择USCorsair RM750x金牌电源。如果你的台式机可能后期会添加显卡,那么你可能要考虑到这个问题,最多加装两个TITAN X的话,1000w电源已经足够了。

9. CPU散热器

考虑到台式机运行过程中CPU散热量较大,可以进行加装CPU风冷,如第一套配置里所用的,也可以进行加装CPU水冷,在第二套土豪级配置中用到了海盗船的水冷散热器。

以上是对深度学习装备的分析,以及面对8000和20000元分别推荐的配置清单。

其实,作者自己曾经花费4万元组装了一台深度学习工作站,更土豪的朋友可以点击阅读原文查看知乎上所提到的具体配置,或者进群一起讨论性能更高的配置方案。

量子位新建了一个机器学习入门群,欢迎来讨论装机、环境配置以及网络原理等一切跟机器学习/深度学习技术有关的问题。

入群方法:加小助手微信qbitbot,注明“加入门群”,然后介绍一下你自己,符合要求我们会拉你入群

我们后续还可能根据大家需要,推出关于Ubuntu系统安装以及TensorFlow、Caffe等框架的配置文章,欢迎在群里多提需求和建议。

笔芯~

△ 扫码强行关注『量子位』

追踪人工智能领域最劲内容

戳原文,学习如何装一台4万多元的工作站

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部