Ubuntu 18.04 RTX2080(ti) + tensorflow-gpu + cuda9.0 + gcc5 兼容性問題解決

0.下載display driver、cuda和cudnn

RTX2080 Display Driverlinux

cudaubuntu

cudnnbash

1. 禁止系統默認的顯卡驅動

打開系統黑名單服務器

sudo gedit /etc/modprobe.d/blacklist.conf
將下列代碼填入文件末尾app

# for nvidia display driver install
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

更新initramfs測試

sudo update-initramfs -u

重啓電腦.net

sudo reboot

查看是否禁用成功,無輸出則禁用成功命令行

lsmod | grep nouveauserver

 

2. RTX2080顯卡驅動安裝


首先安裝gcc,g++,makeblog

sudo apt-get install -y gcc g++ make

Ctrl+Alt+F1~F6進入命令行模式

sudo chmod a+x NVIDIA-Linux-x86_64-410.57.run
sudo ./NVIDIA-Linux-x86_64-410.57.run

注意1:若是原來安裝過,須要先卸載(會卸載掉以前安裝的版本),再進行安裝

sudo ./NVIDIA-Linux-x86_64-410.57.run -uninstall

或者

sudo apt-get --purge remove nvidia-*

最好在進行

sudo apt-get autoremove

注意2:安裝報錯(xxx nvidia-drm xxx),進行以下命令,再卸載,再進行安裝

sudo systemctl isolate multi-user.target
sudo modprobe -r nvidia-drm
# 從新啓動圖形界面
# systemctl start graphical.target

注意3:在遠程服務器報錯(You appear to be running an X server),則使用以下命令關閉 X server,再卸載,再進行安裝

sudo service lightdm stop


3. cuda9.0的安裝


gcc和g++版本降級,ubuntu18.04默認gcc7.3,降級爲gcc5,則ubuntu17.04和ubuntu16.04的cuda9.0都能編譯

sudo apt-get install gcc-5 gcc-5-multilib g++-5 g++-5-multilib

將gcc和g++版本切換成gcc5和g++5

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 40
sudo update-alternatives --config gcc

輸入想要使用的gcc編號

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-7 40
sudo update-alternatives --config g++

輸入想要使用的g++編號,查看gcc版本,已經切換到了gcc5

gcc -v

cuda9.0安裝

sudo sh cuda_9.0.176_384.81_linux.run

是否安裝顯卡驅動選擇no,以前已經安裝過了
設置cuda環境變量

gedit ~/.bashrc

在.bashrc文件末尾添加以下代碼,則當前用戶能夠使用

# cuda9.0
export PATH=$PATH:/usr/local/cuda/bin/
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/

或者在profile中添加上面代碼,則全部用戶都能使用

gedit /ect/profile

重啓電腦

sudo reboot

測試cuda9.0是否安裝成功

cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

最後輸出的是Result = PASS,說明cuda9.0安裝成功了

 

4. cudnn的安裝


解壓cudnn

tar -zxvf cudnn_xxx.tar.gz

cd cudnn-9.0-linux-x64-v7.3.1.20
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

5. pycharm中的配置

Run — Edit Configurations — Environment variables — 點擊右邊的文件夾圖案 — 點擊+號
name中輸入:LD_LIBRARY_PATH
value中輸入:/usr/local/cuda-9.0/lib64
這樣 import tensorflow 就不會報錯說找不到 libcublas.so.9.0

6. OK成功,愉快的使用吧

參考博客--------------------- 做者:VcosmosV 來源:CSDN 原文:https://blog.csdn.net/VcosmosV/article/details/83022682 版權聲明:本文爲博主原創文章,轉載請附上博文連接!

相關文章
相關標籤/搜索