GPU機器安裝paddle

時間 2019-11-09

標籤 gpu 機器安裝 paddle 简体版

原文原文鏈接

安裝基礎包

 
          yum -y install epel-release 
         
          yum -y install kernel-devel 
         
          yum -y install dkms

編輯文件 /etc/default/grub 修改 「GRUB_CMDLINE_LINUX」
rd.driver.blacklist=nouveau nouveau.modeset=0html

grub2-mkconfig -o /boot/grub2/grub.cfg

重啓java

安裝顯卡驅動

下載顯卡驅動python

 
          https://www.nvidia.com/Download/index.aspx?lang=en-us 
         
          下載完成是相似這樣的文件 NVIDIA-Linux-x86_64- 
          410.72 
          .run 直接執行便可, 
         
          卸載 直接接參數 --uninstall 
         
          驗證驅動是否正常 
         
          nvidia-smi

安裝CUDA 9.0

咱們使用rpm的方式安裝linux

 
          https: 
          //developer.nvidia.com/cuda-91-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=rpmlocal

須要把patch也一併下載git

 
     
      
        
          -rw-r--r--  
          1  
          root root    
          155023660  
          Jul  
          14   
          2018  
          cuda-repo-rhel7- 
          9 
          - 
          0 
          - 
          176 
          -local-patch- 
          4 
          - 
          1.0 
          - 
          1 
          .x86_64.rpm 
         
 
          -rw-r--r--  
          1  
          root root   
          1595730326  
          Sep  
          23   
          2017  
          cuda-repo-rhel7- 
          9 
          - 
          0 
          -local- 
          9.0 
          . 
          176 
          - 
          1 
          .x86_64.rpm 
         
 
          -rw-r--r--  
          1  
          root root    
          150679337  
          Dec  
          21   
          2017  
          cuda-repo-rhel7- 
          9 
          - 
          0 
          -local-cublas-performance-update- 
          1.0 
          - 
          1 
          .x86_64.rpm 
         
 
          -rw-r--r--  
          1  
          root root    
          149765568  
          Feb  
          15   
          2018  
          cuda-repo-rhel7- 
          9 
          - 
          0 
          -local-cublas-performance-update- 
          2 
          - 
          1.0 
          - 
          1 
          .x86_64.rpm 
         
 
          -rw-r--r--  
          1  
          root root    
          173037836  
          May  
          24   
          2018  
          cuda-repo-rhel7- 
          9 
          - 
          0 
          -local-cublas-performance-update- 
          3 
          - 
          1.0 
          - 
          1 
          .x86_64.rpm 
         
 
      
 
     
   

在安裝時,可能會有寫軟件包有衝突,好比ipa-client, salt-minion等, 咱們能夠暫時先把有衝突的卸載,回頭在裝回來docker

衝突的緣由是用yum安裝了python的模塊,會形成python的pip管理有問題, 因此有衝突網絡

rpm -ivh 安裝完這些rpm 還沒完事, 它其實只是解壓在了/var目錄ide

 
     
      
        
          (paddle-venv) root 
          @algorithmgpu 
          - 
          11 
          - 
          123 
          :/var# ls -ld /var/cuda* 
         
 
          drwxr-xr-x  
          3  
          root root   
          138  
          Aug   
          6  
          11 
          : 
          48  
          /var/cuda-repo- 
          9 
          - 
          0 
          - 
          176 
          -local-patch- 
          4 
          / 
         
 
          drwxr-xr-x  
          3  
          root root  
          4096  
          Aug   
          6  
          11 
          : 
          56  
          /var/cuda-repo- 
          9 
          - 
          0 
          -local/ 
         
 
          drwxr-xr-x  
          3  
          root root   
          138  
          Aug   
          6  
          11 
          : 
          48  
          /var/cuda-repo- 
          9 
          - 
          0 
          -local-cublas-performance-update/ 
         
 
          drwxr-xr-x  
          3  
          root root   
          138  
          Aug   
          6  
          11 
          : 
          48  
          /var/cuda-repo- 
          9 
          - 
          0 
          -local-cublas-performance-update- 
          2 
          / 
         
 
          drwxr-xr-x  
          3  
          root root   
          182  
          Aug   
          6  
          11 
          : 
          48  
          /var/cuda-repo- 
          9 
          - 
          0 
          -local-cublas-performance-update- 
          3 
          / 
         
 
      
 
     
   

咱們須要在進入這些目錄安裝裏面的rpm, 安裝也是有順序的ui

/var/cuda-repo-9-0-local/ rpm -ivh *
/var/cuda-repo-9-0-local/ rpm -Uvh * 其他patch依次按順序

這樣cuda就安裝完成了, 安裝目錄在 /usr/local/cuda-9.0spa

下面配置環境變量

 
          cat /etc/profile.d/cuda.sh 
         
          export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH} 
         
          export PATH=/usr/local/cuda/bin/:${PATH}

導入一下環境變量 source /etc/profile

安裝cudnn-9.0-linux-x64-v7.1

下載上面的版本

 
          https: 
          //developer.nvidia.com/rdp/cudnn-download

安裝

 
          https: 
          //docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html 
         
          其實只是拷貝到對應目錄 
         
          $ sudo cp cuda/include/cudnn.h /usr/local/cuda/include 
         
          $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 
         
          $ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*