查看本身操做系統的版本信息:cat /etc/issue
或者是 cat /etc/lsb-release
等命令 html
查看服務器顯卡信息:python
lspci | grep -i nvidia
查看所有顯卡信息。
nvidia-smi
若是已經安裝了對應的顯卡驅動的話能夠採用這個命令。
cat /proc/driver/nvidia/version
查看安裝的顯卡的驅動信息。gcc
和g++
是不少驅動安裝過程當中須要使用的編譯器,不少時候因爲編譯器版本的不對應會使得安裝出現不少莫民奇妙的錯誤,根據經驗,如今的CUDA 10.1
的話,也可使用的是4.8
,所以最好選擇4.8-5.4
之間的版本比較好,兼容一點。對於多版本的gcc
和g++
的安裝進行詳細的講解:linux
gcc
和g++
版本:gcc --version
以及 g++ --version
sudo add-apt-repository ppa:ubuntu-toolchain-r/test
首先加入一些更新的倉庫,以便於更新。sudo apt-get update
以及sudo apt get update
對須要的軟件包等進行必要的更新。sudo apt-get install gcc-4.9
以及sudo apt-get install g++-4.9
用於安裝對應版本的gcc
以及g++
。注意本身須要的版本本身修改。sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
gcc
和g++
相似於註冊的操做加入到bin中,用於可選擇操做。也就是說經過這個操做不斷向系統註冊新的gcc
和g++
版本。update-alternatives --config gcc
update-alternatives --config g++
用於對版本進行選擇。進入以後根據提示完成選擇便可。若是權限不夠加 sudo
。
若是須要安裝顯卡的話,須要先將舊版本的顯卡驅動卸載:
sudo apt-get remove --purge nvidia*
此外,安裝以前,須要先禁用一個東西。nouveau。
sudo vim /etc/modprobe.d/blacklist.conf
在文件的最後面加入如下的內容:
ubuntu
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
複製代碼
檢查操做是否成功:lsmod | grep nouveau
沒顯示即成功。
vim
顯卡驅動的安裝比較簡單,直接到官網進行對應的驅動的下載。點我下載 bash
sudo ./NVIDIA-Linux-x86_64-430.34.run
採用該命令進行驅動的安裝。安裝完成以後,能夠採用如下命令進行檢查:
nvidia-smi
CUDA是GPU進行計算的運算平臺,根據須要安裝對應版本的cuda。 服務器
這裏須要注意的是,最好在安裝顯卡驅動的時候選擇對應的cuda
版本,而後在安裝
cuda
的時候的版本保持一致,雖然高版本的驅動能夠兼容低版本的
cuda
。
sudo sh cuda_10.0.130_410.48_linux.run
安裝方式能夠百度一哈。 /usr/local/
下面創建一個軟鏈接cuda
該軟鏈接鏈接到安裝的真正的cuda-10.0
的地址。軟鏈接的創建能夠用於多個版本的cuda的管理。
如圖所示的,黃色的cuda
是一個軟鏈接,紅色的是多個安裝好的CUDA
修改軟鏈接就能夠修改cuda
的版本。
這是安裝完成以後的內容。安裝完成以後,採用nvcc -V
對安裝進行檢查。
若是提示沒有找到對應的命令的話,須要進行環境變量的配置。這裏咱們按照假設創建的cuda的軟鏈接的方式進行配置:
sudo vim ~/.bashrc
加入如下的內容:測試
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
複製代碼
以後再使用nvidia-smi
網站
sudo rm -rf cuda # 刪除舊版本的軟鏈接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda # 創建新版本的軟鏈接,前面的路徑是須要的版本的cuda的安裝路徑。
複製代碼
cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8
這種也是也是tgz
。將下載來的文件進行解壓便可。cp cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8 cudnn-10.0-linux-x64-v7.3.0.29.tgz # 換後綴
tar -xvf cudnn-8.0-linux-x64-v5.1.tgz # 解壓
複製代碼
解壓以後獲得一個 cuda
文件夾。採用以下的操做進行cudnn
的安裝。(這時候的cudnn要直接安裝到對應的版本的cuda的真實的安裝路徑中。這樣創建軟鏈接的時候纔會讀到cudnn文件)ui
sudo cp cuda/include/cudnn.h /usr/local/cuda-xx.x/include # 填寫對應的版本的cuda路徑
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64 # 填寫對應的版本的cuda路徑
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h /usr/local/cuda-xx.xx/lib64/libcudnn*
複製代碼
若是喜歡採用deb的安裝方式的,參見
以上流程若是走下來仍是出錯的話,建議從新卸載顯卡驅動再來一次。
採用Anaconda進行python環境的管理是一個很高效的解決方案。從倉庫下載對應版本的軟件進行安裝。點我下載。
bash Anaconda3-5.0.1-Linux-x86_64.sh
安裝。安裝過程須要贊成將安裝路徑加入到環境變量的配置文件中。
source ~.bashrc
使其生效。
conda create-n your_name python=your_version
source activate your_name
到pytorch官網下載對應版本的pytorch 便可。官網
根據生產的命令進行安裝。安裝完成以後測試:python # 進入python 環境
import torch # 導入安裝的pytorch包
torch.cuda.is_available() # 檢查cuda是否可使用
複製代碼
若是torch.cuda.is_available()
若是輸出是false,那就表示前面的驅動或者cuda的安裝有問題,最可能的就是驅動。直接卸載從新安裝顯卡驅動便可解決問題。