Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置說明

本文安裝顯卡驅動的方式已通過時, 最新安裝說明請參考發佈在Gist上的這篇文章若有任何疑問,仍然歡迎在本文下留言 :Phtml

(本文檔使用同一塊NVIDIA顯卡進行顯示與計算, 如分別使用不一樣的顯卡進行顯示和計算,則可能不適用。)python

1. 安裝build-essentials

安裝開發所須要的一些基本包linux

sudo apt-get install build-essential

2. 安裝NVIDIA驅動 (3.4.0)

2.1 準備工做(2014-12-03更新

在關閉桌面管理 lightdm 的狀況下安裝驅動彷佛能夠實現Intel 核芯顯卡 來顯示 + NVIDIA 顯卡來計算。具體步驟以下:git

1. 首先在BIOS設置裏選擇用Intel顯卡來顯示或做爲主要顯示設備github

2. 進入Ubuntu, 按 ctrl+alt+F1 進入tty, 登陸tty後輸入以下命令shell

sudo service lightdm stop

該命令會關閉lightdm。若是你使用 gdm或者其餘的desktop manager, 請在安裝NVIDIA驅動前關閉他。bash

2.2 安裝驅動

輸入下列命令添加驅動源app

sudo add-apt-repository ppa:xorg-edgers/ppa
sudo apt-get update

安裝340版驅動 (CUDA 6.5.14目前最高僅支持340版驅動, 343, 346版驅動暫不支持)eclipse

sudo apt-get install nvidia-340

安裝完成後, 繼續安裝下列包 (不然在運行sample時會報錯)post

sudo apt-get install nvidia-340-uvm

安裝完成後 reboot.

3. 安裝CUDA 6.5

點擊此連接】 下載CUDA 6.5. 

而後經過下列命令, 將下載獲得的.run文件解壓成三個文件, 分別爲

  • CUDA安裝包: cuda-linux64-rel-6.5.14-18749181.run
  • NVIDIA驅動: NVIDIA-Linux-x86_64-340.29.run
  • SAMPLE包: cuda-samples-linux-6.5.14-18745345.run

這裏不安裝NVIDIA驅動

cuda6.5.run --extract=extract_path

注意, 須要經過下面命令給全部.run文件可執行權限

chmod +x *.run

 

3.1 安裝CUDA

經過下列命令安裝CUDA, 按照說明一步一步安裝至完成.

sudo ./cuda-linux64-rel-6.5.14-18749181.run

3.1.1 添加環境變量

安裝完成後須要在/etc/profile中添加環境變量, 在文件最後添加:

PATH=/usr/local/cuda-6.5/bin:$PATH
export PATH

保存後, 執行下列命令, 使環境變量當即生效

source /etc/profile

3.1.2 添加lib庫路徑

/etc/ld.so.conf.d/加入文件 cuda.conf, 內容以下

/usr/local/cuda-6.5/lib64

執行下列命令使之馬上生效

sudo ldconfig

 

3.2 安裝CUDA SAMPLE

首先安裝下列依賴包

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa-dev

而後用下述命令安裝sample文件

sudo ./cuda-samples-linux-6.5.14-18745345.run

完成後編譯Sample文件, 整個過程大概10分鐘左右

cd /usr/local/cuda-6.5/samples
sudo make

 所有編譯完成後, 進入 samples/bin/x86_64/linux/release, sudo下運行deviceQuery

sudo ./deviceQuery

若是出現下列顯卡信息, 則驅動及顯卡安裝成功:

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 670"
  CUDA Driver Version / Runtime Version          6.5 / 6.5
  CUDA Capability Major/Minor version number:    3.0
  Total amount of global memory:                 4095 MBytes (4294246400 bytes)
  ( 7) Multiprocessors, (192) CUDA Cores/MP:     1344 CUDA Cores
  GPU Clock rate:                                1098 MHz (1.10 GHz)
  Memory Clock rate:                             3105 Mhz
  Memory Bus Width:                              256-bit
  L2 Cache Size:                                 524288 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device PCI Bus ID / PCI location ID:           1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.5, CUDA Runtime Version = 6.5, NumDevs = 1, Device0 = GeForce GTX 670
Result = PASS

 4. 安裝Intel MKL 

(若是沒有能夠安裝OpenBLAS代替)解壓安裝包,下面有一個install_GUI.sh文件, 執行該文件,會出現圖形安裝界面,根聽說明一步一步執行便可。

注意: 安裝完成後須要添加library路徑

sudo gedit /etc/ld.so.conf.d/intel_mkl.conf

在文件中添加內容

/opt/intel/lib
/opt/intel/mkl/lib/intel64

注意把路徑替換成本身的安裝路徑。 編輯完後執行

sudo ldconfig

 

5. 安裝OpenCV

這個儘可能不要手動安裝, Github上有人已經寫好了完整的安裝腳本:https://github.com/jayrambhia/Install-OpenCV

下載該腳本,進入Ubuntu/2.4 目錄, 給全部shell腳本加上可執行權限

chmod +x *.sh

而後安裝最新版本 (當前爲2.4.9)

sudo ./opencv2_4_9.sh

腳本會自動安裝依賴項,下載安裝包,編譯並安裝OpenCV。整個過程大概半小時左右。 

注意,中途可能會報錯

opencv-2.4.9/modules/gpu/src/nvidia/core/NCVPixelOperations.hpp(51): error: a storage class is not allowed in an explicit specialization

解決方法在此:http://code.opencv.org/issues/3814  下載 NCVPixelOperations.hpp 替換掉opencv2.4.9內的文件, 從新build。

6. 安裝其餘依賴項

Ubuntu14.04用戶執行

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libboost-all-dev libhdf5-serial-dev libgflags-dev libgoogle-glog-dev liblmdb-dev protobuf-compiler

其餘版本用戶參考官方說明:http://caffe.berkeleyvision.org/installation.html

7. 安裝Caffe所須要的Python環境

首先安裝pip和python-dev (系統默認有python環境的, 不過咱們須要的使python-dev)

sudo apt-get install python-dev python-pip

而後執行以下命令安裝編譯caffe python wrapper 所須要的額外包

for req in $(cat requirements.txt); do sudo pip install $req; done

在執行上述命令時, 會報錯致使不能徹底安裝全部須要的包。 能夠按照官方建議安裝anaconda包。 在anaconda官網下載.sh文件,執行,最後添加bin目錄到環境變量便可。

2014-12-03更新

建議安裝Anaconda包,這個包能獨立於系統自帶的python庫,而且提供大部分Caffe須要的科學運算Python庫。這裏須要注意,在運行Caffe時,可能會報一些找不到libxxx.so的錯誤,而用 locate libxxx.so命令發現已經安裝在anaconda中,這時首先想到的是在/etc/ld.so.conf.d/ 下面將 $your_anaconda_path/lib 加入 LD_LIBRARY_PATH中。 可是這樣作可能致使登出後沒法再進入桌面!!!緣由(猜想)多是anaconda的lib中有些內容於系統自帶的lib產生衝突。

正確的作法是:爲了避免讓系統在啓動時就將anaconda/lib加入系統庫目錄,能夠在用戶本身的~/.bashrc 中添加library path, 好比我就在最後添加了兩行

 

# add library path
LD_LIBRARY_PATH=your_anaconda_path/lib:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH

開啓另外一個終端後即生效,而且重啓後可以順利加載lightdm, 進入桌面環境。

8. 安裝MATLAB

Caffe提供了MATLAB接口, 有須要用MATLAB的同窗能夠額外安裝MATLAB。 安裝教程請自行搜索。 

安裝完成後添加圖標 http://www.linuxidc.com/Linux/2011-01/31632.htm

sudo vi /usr/share/applications/Matlab.desktop

輸入如下內容

[Desktop Entry]
Type=Application
Name=Matlab
GenericName=Matlab 2010b
Comment=Matlab:The Language of Technical Computing
Exec=sh /usr/local/MATLAB/R2010b/bin/matlab -desktop
Icon=/usr/local/MATLAB/Matlab.png
Terminal=false
Categories=Development;Matlab;

 

(I use the R2013b patched package. First you should uncompress the .iso file. Then use sudo cp to copy the patch file)

9. 編譯Caffe

終於完成了全部環境的配置,能夠愉快的編譯Caffe了! 進入caffe根目錄, 首先複製一份Makefile.config

cp Makefile.config.example Makefile.config

而後修改裏面的內容,主要須要修改的參數包括

CPU_ONLY 是否只使用CPU模式,沒有GPU沒安裝CUDA的同窗能夠打開這個選項

BLAS (使用intel mkl仍是OpenBLAS)

MATLAB_DIR 若是須要使用MATLAB wrapper的同窗須要指定matlab的安裝路徑, 如個人路徑爲 /usr/local/MATLAB/R2013b (注意該目錄下須要包含bin文件夾,bin文件夾裏應該包含mex二進制程序)

DEBUG 是否使用debug模式,打開此選項則能夠在eclipse或者NSight中debug程序

完成設置後, 開始編譯

make all -j4
make test
make runtest

注意 -j4 是指使用幾個線程來同時編譯, 能夠加快速度, j後面的數字能夠根據CPU core的個數來決定, 個人CPU使4核, 因此-j4.

而後去尿個尿,喝杯茶, 回來就差很少編譯好了..

9.1. 編譯Matlab wrapper

執行以下命令

make matcaffe

而後就能夠跑官方的matlab demo啦。

9.2. 編譯Python wrapper

 make pycaffe 

而後基本就所有安裝完拉.

接下來你們盡情地跑demo吧~

----------------------------------

10. 安裝cuDNN

爲了加速Caffe,能夠安裝cuDNN,參見這篇文章:NVIDIA CuDNN 安裝說明 

相關文章
相關標籤/搜索