(对于nvidia官网,我就是想骂娘)
作为深度学习的老人,最近在服务器安装上又绊了跟头,这需要从师弟一拨毁坏性的操作讲起。。。。原来我在服务器刚买回来时(2016.4)上本来是这个版本安装的:ubuntu 14.04 + GTX TITANX 显卡驱动驱动直接官网下载当时最新+cuda7.5+opencv 3.0.0rc+matalbr2014a,没问题,师弟一拨乱搞把显卡驱动搞崩了。
当前新显卡如1080和1080TI的安装很简单,安装ubuntu16.04后,直接下载官网的显卡驱动和cuda版本即可,安装非常方便,这是因为他们对新cuda都支持!!!所以这里一定强调的是GTX TITANX(老泰坦)
然而,现在ubuntu16.04长期支持版出来了,并且安装深度学习过程比14.04简单好多,所以我就装了个16.04系统,然后按照傻逼NVIDIA官网直接下载的cuda版本cuda9.1(按照操作系统版本和),安装相对简单。安装完后显卡检查没问题、cuda 样例正常跑,但是只要重启服务器就会循环登录。。查了好多,都不行。
我得出的结论是GTX TITANX 不支持cuda8.0及以上版本!!!但是因为我选择的是16.04版本的系统,傻逼nvidia在选择cuda版本是都是8.0以上的,还他妈说cuda是向下兼容的!!!以此为证:
最终解决的是还是安装14.04系统,显卡驱动还是安装官网最新的(注意操作系统类型、系统语言对应),安装cuda7.0。下面是gtx titanx相关caffe包截图:
我得出的结论是GTX TITANX 不支持cuda8.0及以上版本!!!装什么版本的cuda的要看显卡的型号,别被傻逼nvidia官方放出的cuda蒙蔽了。