centos下經過conda安裝pytorch

1、安裝anacondaphp

 anaconda安裝簡單,只要肯定本身的系統便可,具體安裝請參考這裏html

 

2、肯定本身的系統版本python

 個人是centoslinux

cat /etc/redhat-release

 查看linux系統方法:docker

# 方法一
cat /proc/version

# 方法二
lsb_release -a

# 方法三
cat /etc/issue

# 方法四
cat /etc/redhat-release

 

3、肯定本身的CUDA版本vim

 什麼是cuda:centos

  CUDA(ComputeUnified Device Architecture),是顯卡廠商NVIDIA推出的運算平臺。 CUDA是一種由NVIDIA推出的通用並行計算架構,該架構使GPU可以解決複雜的計算問題bash

  簡單說強大的芯片若是隻是做爲顯卡就太浪費了,所以N卡廠商推出CUDA,讓顯卡能夠用於圖像計算之外的目的網絡

 

 什麼是cudnn:(注意:CUDA和CuDNN通常都是結伴而行,若是須要CUDA,必然會須要CuDNN)架構

 下載地址:注意這裏須要註冊才能下載,我用qq郵箱,密碼首字母大寫

  CUDA看做是一個工做臺,上面配有不少工具,如錘子、螺絲刀等。cuDNN是基於CUDA的深度學習GPU加速庫,有了它才能在GPU上完成深度學習的計算。它就至關於工做的工具,好比它就是個扳手

  可是CUDA這個工做臺買來的時候,並無送扳手。想要在CUDA上運行深度神經網絡,就要安裝cuDNN,就像你想要擰個螺帽就要把扳手買回來。這樣才能使GPU進行深度神經網絡的工做,工做速度相較CPU快不少

  cudnn下載解壓後cuda目錄下有下面內容:

  修改權限:

sudo cp include/cudnn.h /usr/local/cuda/include
sudo cp lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

 

 Centos7安裝NVIDIA顯卡驅動和CUDA10.1(以10.1爲例):

  先查看本身的linux上顯卡型號:

lspci | grep -i nvidia

   可見個人顯卡槓槓滴

 

  顯卡驅動下載:(下載與本身顯卡型號一致的驅動)

 

 

 

 

   注意:在安裝顯卡驅動的時候若是報錯

ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel.  This may be because it is in use (for example, by the X server), but may also happen if your kernel was configured

  咱們須要查看是否有程序佔用(若是存在佔用,請停掉該程序)

lsof | grep nvidia.uvm

 

  固然顯卡驅動也能夠這樣安裝:(推薦)

sudo yum install nvidia-detect  # 安裝檢查顯卡的程序
nvidia-detect -v  # 查看須要的顯卡驅動型號
yum -y install kmod-nvidia  # 安裝驅動

   卸載驅動:

sudo yum remove kmod-nvidia

  

  若是經過官網下載驅動安裝時找不到kernel,經過下面的方式安裝驅動(確保kernel已經安裝)

sudo ./NVIDIA-Linux-x86_64-430.40.run --kernel-source-path=/usr/src/kernels/3.10.0-514.el7.x86_64

  

  cuda下載

  

  檢查linux是否安裝了GPU

lspci | grep -i nvidia

 

  安裝 cuda 的時候,會詢問是否安裝顯卡驅動,說明 cuda 安裝程序裏包含了的顯卡驅動;建議先不要安裝 cuda 裏的顯卡驅動,待安裝完 cuda 後,執行例子程序,若是報錯再檢查顯卡驅動是否正確,避免覆蓋原來的顯卡驅動

 

  安裝gcc、g++編譯器:先查看是否已經安裝(gcc -v)

yum install gcc
yum install g++

 

  安裝kernel-devel和kernel-headers:

yum install kernel-devel
yum install kernel-headers

  注意這裏的kernel要和本身的linux系統版本一致:可使用uname -r查看本身的系統版本

uname -r
#3.10.0-514.el7.x86_64

  有時候直接yum安裝的版本比較新,致使顯卡驅動安裝失敗

sudo yum remove kernel-devel # 卸載新的
sudo rpm -i kernel-devel-3.10.0-514.el7.x86_64.rpm #下載安裝適合的版本

  版本下載

 

  編輯grub文件

vim /etc/default/grub

  GRUB_CMDLINE_LINUX中的末尾(注意要包含在引號內)添加/rd.driver.blacklist=nouveau nouveau.modeset=0

  隨後生成配置:

grub2-mkconfig -o /boot/grub2/grub.cfg

  

  禁用nouveau將blacklist nvidiafb註釋掉,並添加以下內容,禁用的緣由點擊這裏

   blacklist nouveau
   options nouveau modeset=0

 

  更新配置並重啓:

sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
reboot

  

  重啓後確認禁用了nouveau:

lsmod | grep nouveau
# 沒有內容輸出表示禁用成功

  

  賦予權限並安裝驅動和CUDA-10.0:

./NNVIDIA-Linux-x86_64-430.50.run
./cuda_10.1.243_418.87.00_linux.run

 

  查看安裝結果

nvidia-smi

  顯卡驅動和cuda安裝成功後,就能夠用conda install 來安裝python包了(注意:虛擬機沒法調用GPU,即便全部的環境配置好,代碼依然會報:all cuda 忙或者不可用的錯誤

  推薦搭建使用docker來安裝深度學習環境,方便部署

  總結:你們能夠參考這個來安裝深度學習框架

相關文章
相關標籤/搜索