(通用)深度學習環境搭建:tensorflow安裝教程及常見錯誤解決

區別於其餘入門教程的「手把手式」,本文更強調「因」而非「果」。我之因此加上「通用」字樣,是由於在你瞭解了這個開發環境以後,那些很low的錯誤你就不會犯了。
你們都知道深度學習涉及到大量的模型、算法,看着那些亂糟糟的公式符號,心中必定是「WTF」。我想說的是,這些你都不要管,所謂車到山前必有路。python

所需安裝包

一般以個人習慣是以最簡單的方式來接觸一門新的技術,而且儘可能拋棄新的(邊緣)技術的介入,若是由於一些其餘因素來致使學習樹的不斷擴大,會變得很低效,因此咱們直擊核心。以最經常使用的windows環境爲例。
這裏以windows7+TensorFlow-gpu1.5+cuda8+cudnn6+anaconda5+python3.6爲例。這裏強烈推薦GPU版本,由於深度學習動輒幾小時、幾天、幾周的運行市場,GPU加速會節省你不少時間(甚至電費)。git

  1. cuda_8.0.61_windows.exe http://developer2.download.nvidia.com/compute/cuda/8.0/secure/Prod2/local_installers/cuda_8.0.61_windows.exe: 從NIVDIA官網下載須要找到歷史版本Legacy Releases。 tensorflow代碼引用的cuda庫必須絕對匹配,好比tensorflow1.3-1.5都使用cuda8的庫,目前(2017-10-24 20:40:53)不支持cuda9庫。
    這裏有一個關於cuda8的補丁,修復了8.0的一些bughttp://developer2.download.nvidia.com/compute/cuda/8.0/secure/Prod2/patches/2/cuda_8.0.61.2_windows.exe
  2. cudnn-8.0-windows7-x64-v6.0.zip http://developer2.download.nvidia.com/compute/machine-learning/cudnn/secure/v6/prod/8.0_20170427/cudnn-8.0-windows7-x64-v6.0.zip
    和上面的緣由同樣,請匹配6.0版本。
  3. tensorflow https://github.com/tensorflow/tensorflow
    我之因此給出github的地址是由於tensorflow團隊在github上天天12:34都有一次build,而且github不受「種種」網絡因素的影響。在tensorflow找到python3.6對應gpu版本build history,找到whl文件地址。
  4. Anaconda3-5.0.0-Windows-x86_64.exe https://www.anaconda.com/download/
    anaconda有一個最大的好處就是安裝各類python庫比較方便。

安裝包關係

anaconda至關於tensorflow運行的容器。anaconda能夠建立多個「盒子」(environment),每一個盒子中的環境互不干擾,因此使用anaconda能夠同時安裝python3.5/3.6,tensorflow1.3/1.5。
cuda和cudnn是tensorflow調用gpu所須要的庫。也就是說tensorflow必須經過cuda和cudnn來調用電腦的gpu。
圖片描述github

安裝

安裝anaconda、anaconda、cuda、cudnn

  1. anaconda、cuda、cudnn安裝便可。在安裝過程當中會自動配置環境變量。
  2. 不過須要手動將cuda的development目錄配置到CUDA_HOME中。
  3. 將cudnn解壓後,把文件複製到cuda對應目錄。

安裝tensorflow

  1. 啓動anaconda,點擊environments(環境),點擊create(新建),命名tensorflow-gpu,選取3.6版本。
  2. 點擊tensorflow-gpu啓動Open Terminal,輸入activate tensorflow-gpu。這時,anaconda下名字叫作tensorflow-gpu的環境已經啓動了。下面咱們才真正開始安裝tensorflow。
  3. 輸入
    pip install --ignore-installed --upgrade http://ci.tensorflow.org/view/tf-nightly/job/tf-nightly-windows/M=windows-gpu,PY=36/lastSuccessfulBuild/artifact/cmake_build/tf_python/dist/tf_nightly_gpu-1.5.0.dev20171024-cp36-cp36m-win_amd64.whl

稍等片刻tensorflow就安裝成功了。算法

測試tensorflow環境

  1. 點擊anaconda下咱們建立的環境tensorflow-gpu啓動Open With Python
  2. 輸入import tensorflow若是不報錯就說明安裝成功了。

常見錯誤

  1. ImportError: DLL load failed: 找不到指定的模塊。 這個錯誤一般是cuda或者cudnn與tensorflow的版本對應錯誤。推薦下載cuda8+cudnn6。
    固然,隨着時間推移這些版本會被淘汰,但本教程依然適用。在github上找到tensorflow項目,在項目內搜索TF_CUDA_VERSIONTF_CUDNN_VERSION會看到當前tensorflow對應的是哪一個cuda和cudnn版本。
  2. 其餘錯誤。
    除1的錯誤外我暫時沒碰到其餘錯誤,若是出現排錯的思路是,確認版本-->確認庫是否包含在path中。若是依然沒法解決,能夠加我微信takeurhand討論。

運行mnist例子

  1. mnist例子運行須要安裝matplotlib庫,這時候anaconda的方便之處就得以體現了。點擊anaconda下tensorflow-gpu環境,再右側搜索matplotlib,勾選並點擊apply便可。
  2. 下載github上mnist教程例子https://github.com/martin-gorner/tensorflow-mnist-tutorial,並解壓。
  3. 啓動anaconda下tensorflow-gpu環境Open Terminal,輸入activate tensorflow-gpu,cd到步驟2解壓目錄。
  4. 執行python mnist_xx.py
    圖片描述
相關文章
相關標籤/搜索