GPU機器安裝paddle

安裝基礎包

yum -y install epel-release
yum -y install kernel-devel
yum -y install dkms

編輯文件 /etc/default/grub 修改 「GRUB_CMDLINE_LINUX
rd.driver.blacklist=nouveau nouveau.modeset=0html

 

grub2-mkconfig -o /boot/grub2/grub.cfg

重啓java

安裝顯卡驅動

下載顯卡驅動python

 
 
下載完成是相似這樣的文件 NVIDIA-Linux-x86_64- 410.72 .run 直接執行便可,
卸載 直接接參數 --uninstall
 
 
驗證驅動是否正常
nvidia-smi

安裝CUDA 9.0

咱們使用rpm的方式安裝linux

https: //developer.nvidia.com/cuda-91-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=rpmlocal

須要把patch也一併下載git

-rw-r--r--  1  root root    155023660  Jul  14   2018  cuda-repo-rhel7- 9 - 0 - 176 -local-patch- 4 - 1.0 - 1 .x86_64.rpm
-rw-r--r--  1  root root   1595730326  Sep  23   2017  cuda-repo-rhel7- 9 - 0 -local- 9.0 . 176 - 1 .x86_64.rpm
-rw-r--r--  1  root root    150679337  Dec  21   2017  cuda-repo-rhel7- 9 - 0 -local-cublas-performance-update- 1.0 - 1 .x86_64.rpm
-rw-r--r--  1  root root    149765568  Feb  15   2018  cuda-repo-rhel7- 9 - 0 -local-cublas-performance-update- 2 - 1.0 - 1 .x86_64.rpm
-rw-r--r--  1  root root    173037836  May  24   2018  cuda-repo-rhel7- 9 - 0 -local-cublas-performance-update- 3 - 1.0 - 1 .x86_64.rpm

在安裝時,可能會有寫軟件包有衝突,好比ipa-client, salt-minion等, 咱們能夠暫時先把有衝突的卸載,回頭在裝回來docker

衝突的緣由是用yum安裝了python的模塊,會形成python的pip管理有問題, 因此有衝突網絡

rpm -ivh 安裝完這些rpm 還沒完事, 它其實只是解壓在了/var目錄ide

(paddle-venv) root @algorithmgpu - 11 - 123 :/var# ls -ld /var/cuda*
drwxr-xr-x  3  root root   138  Aug   6  11 : 48  /var/cuda-repo- 9 - 0 - 176 -local-patch- 4 /
drwxr-xr-x  3  root root  4096  Aug   6  11 : 56  /var/cuda-repo- 9 - 0 -local/
drwxr-xr-x  3  root root   138  Aug   6  11 : 48  /var/cuda-repo- 9 - 0 -local-cublas-performance-update/
drwxr-xr-x  3  root root   138  Aug   6  11 : 48  /var/cuda-repo- 9 - 0 -local-cublas-performance-update- 2 /
drwxr-xr-x  3  root root   182  Aug   6  11 : 48  /var/cuda-repo- 9 - 0 -local-cublas-performance-update- 3 /

咱們須要在進入這些目錄安裝裏面的rpm, 安裝也是有順序的ui

  1. /var/cuda-repo-9-0-local/   rpm -ivh *
  2. /var/cuda-repo-9-0-local/   rpm -Uvh *    其他patch依次按順序

這樣cuda就安裝完成了, 安裝目錄在 /usr/local/cuda-9.0spa

下面配置環境變量

cat /etc/profile.d/cuda.sh
export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}
export PATH=/usr/local/cuda/bin/:${PATH}

導入一下環境變量  source  /etc/profile

 

安裝cudnn-9.0-linux-x64-v7.1

下載上面的版本
https: //developer.nvidia.com/rdp/cudnn-download
安裝
https: //docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html
其實只是拷貝到對應目錄
 
 
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

編譯安裝paddle

文檔

https://paddlepaddle.org.cn/documentation/docs/zh/1.5/beginners_guide/install/compile/compile_CentOS.html

注意這句話 執行編譯前請您確認在虛環境中安裝有編譯依賴表中提到的相關依賴:

咱們使用本機編譯的方法, 非docker

照着文檔一步步作就能夠了

tips

make -j$(nproc) 這個命令執行時間可能得半天,根據不一樣網絡而定

由於要下載不少git上的倉庫

最後這個paddle的目錄有 8.4G

相關文章
相關標籤/搜索