Ubuntu Server 18.04 搭建深度學習平臺

一、設置python版本python

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150bash

二、安裝Anaconda虛擬環境管理學習

wget https://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.shurl

# bash Anaconda3-5.2.0-Linux-x86_64.sh命令行

記得把環境變量添加在系統中,最後是否安裝VScode建議不安裝code

三、安裝CUDA和cuDNN,在版本選擇上由於GPU緣由選擇CUDA10.0和相應的cuDNNblog

選擇對應系統的版本,在線安裝:https://developer.nvidia.com/cuda-10.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=debnetworkget

https://developer.nvidia.com/rdp/cudnn-download須要註冊登陸帳號,下載後解壓深度學習

sudo cp cuda/include/cudnn.h    /usr/local/cuda/include      
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*it

四、下載並安裝GPU驅動

https://www.nvidia.cn/Download/index.aspx?lang=cn

lsmod | grep nvidia,若是有NVIDIA驅動,請先卸載

lsmod | grep nouveau,若是有其餘驅動,將其餘顯卡驅動加入黑名單,操做以下:

cd /etc/modprobe.d/

建立blacklist-nouveau.conf並添加內容

sudo touch blacklist-nouveau.conf

sudo echo "blacklist nouveau">>blacklist-nouveau.conf

sudo echo "options nouveau modeset=0">>blacklist-nouveau.conf

查看blacklist-nouveau.conf內容是否添加成功

sudo cat blacklist-nouveau.conf

sudo update-initramfs -u

如今請重啓機器,使用init 3進入命令行界面

sudo chmod +x NVIDIAXXXXXXXXX.run

sudo ./NVIDIAXXXXXXXX.run -no-opengl-files 完成安裝

nvidia-smi檢查顯卡是否在工做

五、建立conda虛擬環境,安裝Tensorflow或者Pytorch

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

conda config --set show_channel_urls yes

conda create --name XXXX python=3.X

conda install pytorch torchvision cudatoolkit=10.0 -c pytorch

到這裏,你的深度學習平臺已經搭建完成,你能夠把它分享給其餘人使用了。

不足之處,還望指正,謝謝!!

相關文章
相關標籤/搜索