搞深度學習如何可以不與渾身是「核」的顯卡打交道呢?linux
人工智能的興起除了數據量的大量提高,算法的不斷改進,計算能力的逐步提升,還離不開軟件基礎設施的逐步完善。當下的主流的深度學習工具軟件不管是Caffe仍是Theano或者是Tensorflow所有都離不開GPU顯卡加速技術的支持。當下的基於GPU加速的主流的深度學習環境就是linux下的cuda。做爲NVIDIA目前輔科學計算加速的性能優良的產品,Tesla K80當仁不讓地成爲了理想對象。但是因爲linux開源的特性,nouveau成爲Ubuntu等一系列的linux操做系統中的默認NVIDIA顯卡驅動程序。然而做爲NVIDIA這樣高冷的公司,集市式的產品是不被承認的。因而爲了保障本身的顯卡的性能,NVIDIA顯卡自帶了驅動,可就是這個根正苗紅的驅動和草根版的驅動之間居然存在着不可和解的衝突。所以想要使用Ubuntu操做系統來帶動K80仍是要費一些周折的,但是問題的核心就在於解決兩個階級的驅動之間的對立關係,方法很簡單,革掉一個就行了嘛。下面來介紹一下具體的操做步驟。算法
一、安裝ubuntu14.04(具體的操做方式就很少說了,可是要強調一點的是DELL的我的pc在安裝Ubuntu的時候可能常常有圖形界面不可用的狀況,估計也是驅動之間不兼容的問題,若是沒有獨立顯卡的話仍是不要折騰了。所幸的是本次搭建的環境是PowerEdgeC4230這個DELL的服務器,因此裝一個gnome仍是沒有啥大問題的)ubuntu
二、因爲是驅動的衝突,那麼天然是要殺掉和顯卡結合不是那麼緊密的草根板驅動nouveau了,加入黑名單使咱們要作的第一件事:服務器
2.1在/etc/modprobe.d/文件夾下建立blacklist-nouveau.conf文件編輯器
2.2使用vi便捷新建立的文件在文件中寫入:ide
blacklist nouveau工具
options nouveau modeset=0性能
保存文件(最好使用vi編輯器,儘可能不要使用nano這種不太主流的編輯器,以前安裝失敗了也許就是由於使用了nano編輯的緣故)學習
2.3輸入update initramfs -u命令獲得更新的blacklist人工智能
2.4輸入reboot命令重啓系統,強力保證blacklist生效。
2.5輸入lsmod | grep nouveau查看是否vouveau真的被幹掉了,若是沒有任何內容出現,那麼恭喜你,成功除掉了草民版驅動。
三、下載NVIDIA官方的K80顯卡驅動,咱們這裏用的是361版本的。將驅動文件移動至/root/文件夾下。
四、若是文件是壓縮文件,則鍵入解壓縮命令進行解壓縮,獲得.run文件
五、接下來是關鍵的步驟,也是困擾咱們一天一晚上的問題所在,鍵入以下命令:
./XXX-NVIDIA.run --no-opengl-files (重要的事情說三遍,這裏面的-和字母之間沒有空格、這裏面的-和字母之間沒有空格、這裏面的‘-’和字母之間沒有空格)
六、出現藍色的背景界面,若是出現了(X server is running的現象,要注意用戶態輸入sudo service lightdm stop關閉桌面管理器 ),而後accept協議,接着出現the distribution provided pre-install scripts failed的提示,忽視它,而後繼續安裝下去,一路OK而後reboot系統,最終獲得完整的gnome桌面系統。
七、檢驗是否安裝成功,在命令行界面下輸入 nvidia-smi檢驗是否安裝成功,若是成功會出現以下圖所示的狀況。