深度學習GPU環境Ubuntu16.04+GTX1080+CUDA9+cuDNN7+TensorFl

本節詳細說明一下深度學習環境配置,Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6。
python

Python 3.6

首先安裝 Python 3.6,這裏使用 Anaconda 3 來安裝,下載地址:https://www.anaconda.com/download/#linux,點擊 Download 按鈕下載便可,這裏下載的是 Anaconda 3-5.1 版本,若是下載速度過慢能夠選擇使用清華鏡像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/。linux

下載下來以後目錄下會出現一個 Anaconda3-5.1.0-Linux-x86_64.sh 文件,而後直接執行便可安裝:bash

bash Anaconda3-5.1.0-Linux-x86_64.sh

執行完畢以後按照默認設置走下來便可完成安裝。app

這裏默認它會安裝到用戶目錄下,若是想全局安裝,能夠在這一步輸入你要安裝的地址:ide

Anaconda3 will now be installed into this location:
/home/cqc/anaconda3

  - Press ENTER to confirm the location
  - Press CTRL-C to abort the installation
  - Or specify a different location below

[/home/cqc/anaconda3] >>> /usr/local/anaconda3
PREFIX=/usr/local/anaconda3

這裏我指定了將其安裝到 /usr/local/anaconda3 目錄下,全局安裝,全部用戶共享,固然若是隻想本用戶使用的話使用默認配置便可。學習

安裝完成以後添加 python3 和 pip3 的軟連接:優化

sudo ln -s /usr/local/anaconda3/bin/python3 /usr/local/sbin/python3
sudo ln -s /usr/local/anaconda3/bin/pip /usr/local/sbin/pip3

這裏是將軟鏈接其添加到 /usr/local/sbin 目錄下了,它默認會存在於環境變量中,所以能夠直接調用。ui

固然也能夠選擇把 /usr/local/anaconda3/bin 目錄添加到環境變量中,能夠修改 ~/.bashrc 文件,添加以下內容:this

export PATH=/usr/local/anaconda3/bin${PATH:+:${PATH}}

而後執行:spa

source ~/.bashrc

便可生效,下次登陸時也會默認執行 ~/.bashrc 文件,也會生效。

接下來咱們驗證下 python三、pip3 命令是否都來自 Anaconda,命令以下:

pip3 -V
pip 9.0.1 from /usr/local/anaconda3/lib/python3.6/site-packages (python 3.6)
which python3
/usr/local/anaconda3/bin/python3
python3
Python 3.6.4 |Anaconda, Inc.| (default, Jan 16 2018, 18:10:19) 
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>

若是輸入 pip3 和 python3 命令能出現如上相似結果,路徑都在 /usr/local/anaconda3,就證實 Python 3 安裝成功了。

安裝驅動

首先查看一下本身的電腦須要怎樣的驅動,咱們能夠先到 http://www.nvidia.com/Download/index.aspx 查詢下咱們須要的是怎樣的驅動,這裏個人顯卡是 GTX 1080,因此以此爲例說明,勾選好對應的配置:點擊 Search,能夠看到查詢結果以下所示:

Version:    390.25
Release Date:    2018.1.29
Operating System:    Linux 64-bit Language:    English (US) File Size:    77.48 MB

這裏說明咱們須要的版本是 390.25。

接下來若是咱們以前安裝了驅動的話,能夠從新安裝一下,若是當前已經安裝好了就沒必要了。

若是要重裝,須要首先卸載掉以前的顯卡驅動:

sudo apt-get remove –purge nvidia*

運行以後 NVIDIA 的一些驅動就被卸載了。

這時候 nvidia-smi 等命令已經不能用了,這就證實顯卡驅動已經被卸載了。

而後接下來添加一個 PPA 源,命令以下:

sudo add-apt-repository ppa:graphics-drivers/ppa

而後更新一下:

sudo apt-get update

隨後從新安裝顯卡驅動:

sudo apt-get install nvidia-390

注意這裏的 390 就是剛纔咱們查詢出來的版本,以實際查詢出來的版本爲準。

CUDA 9.0

若是存在以前的舊版本,能夠選擇先卸載,以避免和新的 CUDA 版本產生衝突,在 /usr/local/cuda/bin 目錄下有一個 uninstallcuda*.pl 文件,能夠直接運行卸載,命令以下:

sudo ./uninstall_cuda_*.pl

這樣便可將 CUDA 所有卸載。

接下來咱們再下載 CUDA 9.0,注意 TensorFlow 1.5 和 1.6 版本依然只是兼容 CUDA 9.0,沒有兼容 CUDA 9.1,因此不要下載 9.1,CUDA 9.0 的下載地址是:https://developer.nvidia.com/cuda-90-download-archive,而後依次勾選好系統的版本,如圖所示:

圖片這裏咱們選擇 Linux-x86_64-Ubuntu-16.04-runfile 的配置,而後點擊 Base Installer 部分的 Download 按鈕,下載 CUDA 9.0 安裝包。

對應的下載命令是:

wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run

執行此命令,等待下載完成便可。

接下來執行安裝,運行以下命令:

sudo bash cuda_9.0.176_384.81_linux-run

安裝過程須要輸入一些確認選項,過程以下:

Description

The NVIDIA CUDA Toolkit provides command-line and graphical
tools for building, debugging and optimizing the performance
Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n

Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/cqc ]: 

Installing the CUDA Toolkit in /usr/local/cuda-9.0 ...

最後若是出現這樣的提示,就證實 CUDA 安裝好了:

Driver:   Not Selected
Toolkit:  Installed in /usr/local/cuda-9.0
Samples:  Installed in /home/cqc, but missing recommended libraries Please make sure that -   PATH includes /usr/local/cuda-9.0/bin -   LD_LIBRARY_PATH includes /usr/local/cuda-9.0/lib64, or, add /usr/local/cuda-9.0/lib64 to /etc/ld.so.conf and run ldconfig as root To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.0/bin Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.0/doc/pdf for detailed information on setting up CUDA. ***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.0 functionality to work. To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:    sudo <CudaInstaller>.run -silent -driver

而後咱們須要配置一下環境變量,更改 ~/.bashrc 文件,添加以下幾行:

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

修改完畢以後執行一下使其生效:

source ~/.bashrc

這時咱們輸出 CUDA_HOME、LD_LIBRARY_PATH 就能夠看到對應的輸出了:

echo $CUDA_HOME
/usr/local/cuda
echo $LD_LIBRARY_PATH
/usr/local/cuda/lib64

這樣就表明環境變量生效了,CUDA 安裝完成。

cuDNN 7.1

cuDNN 的全稱是 The NVIDIA CUDA® Deep Neural Network library,是專門用來對深度學習加速的庫,它支持 Caffe2, MATLAB, Microsoft Cognitive Toolkit, TensorFlow, Theano 及 PyTorch 等深度學習的加速優化,目前最新版本是 cuDNN 7.1,接下來咱們來看下它的安裝方式。

下載連接:https://developer.nvidia.com/rdp/cudnn-download,須要註冊以後才能打開,這裏咱們選擇 cuDNN v7.1.1 (Feb 28, 2018), for CUDA 9.0,而後選擇 cuDNN v7.1.1 Library for Linux,如圖所示:

圖片

下載下來以後解壓安裝便可:

tar -zxvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

執行完如上命令以後,cuDNN 就安裝好了,這時咱們能夠發如今 /usr/local/cuda/include 目錄下就多了 cudnn.h 頭文件。

TensorFlow 1.6

到如今爲止 Python 3.六、CUDA 9.0 和 cuDNN 7.1 就已經安裝好了,並且環境變量也配置好了,接下來咱們直接安裝 TensorFlow 1.6 便可,TensorFlow 1.6 版本針對 CUDA 9 和 cuDNN 7 作了優化,能夠預構建二進制文件。

這裏須要安裝的是 TensorFlow 的 GPU 版本,命令以下:

pip3 install tensorflow-gpu==1.6.0

安裝完成以後驗證一下:

import tensorflow

若是沒有報錯,那就證實所有環境配置都成功了。

以上即是 Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6 完整環境配置過程。

相關文章
相關標籤/搜索