[譯] IBM 工程師的 TensorFlow 入門指北

時間 2019-11-21

標籤 ibm 工程師 tensorflow 入門简体版

原文原文鏈接

原文地址：Getting started with TensorFlow —— IBM

原文做者：Vinay Rao

譯文出自：掘金翻譯計劃

本文永久連接：github.com/xitu/gold-m…

譯者：JohnJiangLA

校對者：CACppuccino & atuooo

IBM 工程師的 TensorFlow 入門指北

在機器學習的世界中， tensor 是指數學模型中用來描述神經網絡的多維數組。換句話說，一個 tensor 一般是一個廣義上的高維矩陣或者向量。html

經過使用矩陣的秩來顯示維數的簡單方法，tensor 可以將複雜的 n 維向量和超形狀表示成 n 維數組。Tensor 有兩個屬性：數據類型和形狀。前端

關於 TensorFlow

TensorFlow 是一個開源的深度學習框架，它基於 Apache 2.0 許可發佈於 2015年末。從那時起，它就成爲世界上最普遍採用的深度學習框架之一（由 Github 上基於它的項目數量得出）。java

TensorFlow 源自 Google DistBelief，它是由 Google Brain 項目組開發並全部的深度學習系統。Google 從零開始設計它，用於分佈式處理，並在 Google 產品數據中心中以最佳模式運行在定製的應用專用集成電路（ASIC）上，這種集成電路一般也被叫作 Tensor Processing Unit（TPU）。這種設計可以開發出有效的深度學習應用。python

這個框架可以運行在 CPU、 GPU 或者 TPU 上，能夠在服務器、臺式機或者移動設備上使用。開發者能夠在不一樣的操做系統和平臺上部署 TensorFlow，並且不管是在本地環境仍是雲上。許多開發者會認爲，相比相似的深度學習框架（好比 Torch 和 Theano，它們也支持硬件加速技術並被學術界普遍使用），TensorFlow 可以更好地支持分佈式處理，而且在商業應用中擁有更高靈活性和性能表現。react

深度學習神經網絡一般是由多個層組成。它們使用多維數組在層之間傳遞數據或執行操做。一個 tensor 在神經網絡的各層之間「流動」（Flow）。所以，命名爲 TensorFlow。linux

TensorFlow 使用的主要編程語言是 Python。爲 C++、 Java® 語言和 Go 提供了可用但不保證穩定性的的應用程序接口（API），一樣也有不少爲 C#，Haskell， Julia，Rust，Ruby，Scala，R 甚至是 PHP 設計的第三方的綁定。Google 近來發布了一個爲移動設備優化的 TensorFlow-Lite 庫，以使 TensorFlow 應用程序能在 Android 上運行。android

這個教程提供了 TensorFlow 系統的概述，包括框架的優勢，支持的平臺，安裝的注意事項以及支持的語言和綁定。ios

TensorFlow 的優點

TensorFlow 爲開發者提供了不少的好處：git

計算流圖模型。TensorFlow使用名爲有向圖的數據流圖來表示計算模型。這讓開發者可以簡易直接的使用原生工具查看神經網絡層間發生了什麼，並可以交互式地調整參數和配置來完善他們的神經網絡結構。
簡單易用的 API。Python 開發者既可使用 TensorFlow 原生的底層 API 接口或者核心 API 來開發他們本身的模型，也可使用高級 API 庫來構建內置模型。TensorFlow 有不少內建和社區的庫，它也能夠覆蓋更高級的深度學習框架好比 Keras 上充當一個高級 API。
靈活的架構。使用 TensorFlow 的一個主要有點是它具備模塊化，可擴展和靈活的設計。開發者只需更改不多的一些代碼，就能夠輕鬆地 CPU， GPU 或 TPU 處理器之間轉換模型。儘管最初是爲了大規模分佈式訓練和推測而設計的，開發者也可使用 TensorFlow 來嘗試其餘機器學習模型和現有模型的系統優化。
分佈式處理。Google 從零設計了 TensorFlow，目的是讓它能在定製的 ASIC TPU 上分佈式運行。另外，TensorFlow 能夠在多種 NVIDIA GPU 內核上運行。開發人員可以充分利用基於 Intel Xeon 和 Xeon Phi 的 X64 CPU 架構或者基於 ARM64 的CPU 架構的優點。TensorFlow 能夠在多架構和多核心繫統上像在分佈式進程中同樣運行，它能將計算密集型進程當作生產任務移交。開發者可以建立 TensorFlow 集羣。並將這些計算流圖分發到這些集羣中進行訓練。Tensor 能夠同步或異步執行分佈式訓練，既能夠在流圖內部，也能夠跨流圖進行，而且能夠在網絡計算節點間共享內存中的公共數據。
運行性能。性能一般是一個有爭議的話題，可是大部分開發者都明白，任何深度學習框架都依賴於底層硬件，才能達到最優化運行，以低能耗實現高性能。一般，任何框架在其原生開發平臺都應該實現最佳優化。TensorFlow 在 Google TPU 上表現良好，但更使人高興的是，不論是在服務器和臺式機上，仍是在嵌入式系統和移動設備上，它都能在各類平臺上達到高性能。該框架一樣還支持了各類編程語言，數量使人驚訝。儘管另外一個框架在原生環境（好比在 IBM 平臺上運行的 IBM Watson®）上運行有時可能會賽過 TensorFlow，但它仍然是開發人員的最愛，由於人工只能項目會跨越平臺和編程語言，並以多樣的終端應用爲設計目標，而且全部這些都須要生成一致的結果。

TensorFlow 應用

本節將介紹 TensorFlow 擅長的應用程序。顯然，因爲 Google 使用其專有版本的 TensorFlow 開發文本和語音搜索，語言翻譯，和圖像搜索的應用程序，所以 TensorFlow 的的主要優點在於分類和推測。例如，Google 在 TensorFlow 中應用 RankBrain（Google 的搜索結果排名引擎）。github

TensorFlow 可用於優化語音識別和語音合成，好比區分多重聲音或者在高噪背景下過濾噪聲提取語音，在文本生成語音過程當中模擬語音模式以得到更天然的語音。另外，它可以處理不一樣語言中的句型結構以生成更好的翻譯效果。它也一樣能被用於圖像和視頻識別以及對象、地標、人物、情緒、或活動的分類。這帶來了圖像和視頻搜索的重大改進。

由於其靈活，可擴展和模塊化的設計，TensorFlow 不會限制開發人員使用特定的模型或者應用。開發者使用 TensorFlow 不只實現了機器學習和深度學習算法，還實現了統計和通用計算模型。有關應用程序和社區模型的更多信息請查看使用 TensorFlow。

哪些平臺支持 TensorFlow？

各類只要支持 Python 開發環境的平臺就能支持 TensorFlow。可是，要接入一個受支持的 GPU，TensorFlow 須要依賴其餘的軟件，好比 NVIDIA CUDA 工具包和 cuDNN。爲 TensorFlow（1.3 版本）預構建的 Python 二進制文件（當前發佈）可用於下表中列出的操做系統。

注意： 在 Ubuntu 或 Windows 上得到 GPU 加速支持須要 CUDA 工具包 8.0 和 cuDNN 6 或更高版本，以及一塊可以兼容這個版本的工具包和 CUDA Computer Capability 3.0 或更高版本的 GPU 卡。macOS 上 1.2 版本以上的 TensorFlow 再也不支持 GPU 加速。

詳情請參考安裝 TensorFlow。

從源代碼構建 TensorFlow

官方使用 Bazel 在 Ubuntu 和 macOS 構建 TensorFlow。在 Windows 系統下使用 Windows 版本 Bazel 或者 Windows 版 CMake 構建如今還在試驗過程當中，查看從源代碼構建 TensorFlow 。

IBM 在 S822LC 高性能計算系統上使用 NVIDIA NVLink 鏈接線鏈接兩塊 POWER8 處理器和四塊 NVIDIA Tesla P100 GPU 以使 PowerAI 適合進行深度學習。開發者可以在運行 OpenPOWER Linux 的 IBM Power System 上構建 TensorFlow。要了解更多信息能夠查看深度學習在 OpenPOWER 上: 在 OpenPOWER Linux 系統上構建 TensorFlow 。

不少社區或供應商支持的構建程序也可用。

TensorFlow 怎樣使用硬件加速？

爲了支持在更普遍的處理器和非處理器架構上使用 TensorFlow，Google 爲供應商提供了一個新的抽象接口，實現用於加速線性代數（XLA）的新硬件後端，XLA 是一個專爲線性代數計算的特定領域編譯器，它能夠用於優化 TensorFlow 計算過程。

CPU

當前，因爲 XLA 仍是實驗性的，TensorFlow 仍是在 X64 和 ARM64 CPU 架構上受支持，被測試和構建。在 CPU 架構上，TensorFlow 經過使用矢量處理擴展來實現加速線性代數計算。

以 Intel CPU 爲中心的 HPC 體系結構（如 Intel Xeon 和 Xeon Phi 系列）經過使用 Intel 數學核心函數庫來實現深度神經網絡基元，從而得到加速線性代數計算。Intel 也提供了擁有優化線性代數庫的預構建的 Python 優化發行版。

其餘供應商，例如 Synopsys 和 CEVA，使用映射和分析器程序轉換 TensorFlow 流圖和生成優化代碼在他們的平臺上運行。開發者在使用這種途徑時須要移植，分析並調整結果代碼。

GPU

TensorFlow 支持特定的 NVIDIA GPU ，這些 GPU 可以兼容相關版本的 CUDA 工具包並符合相關的性能標準。儘管一些社區努力在 OpenCL 1.2 兼容的 GPU （好比 AMD 的）上運行 TensorFlow，OpenCL 支持還是一個正在計劃建設的項目，

TPU

據 Google 稱，基於 TPU 的流圖比 CPU 或 GPU 上執行性能好 15-30 倍，而且很是節能。Google 將 TPU 設計成一個外部加速器，能夠插入串行 ATA 硬盤插槽，並經過 PCI Express Gen3 x16 接口鏈接主機，從而實現高帶寬吞吐。

Google TPU 是矩陣處理器而不是矢量處理器，而且神經網絡不須要高精度的數學運算，而是使用大規模並行的低精度整數運算。絕不奇怪，矩陣處理器（MXU）結構具備 65,536 8-bit 乘法器，並經過脈動陣列結構波動推進數據，就像經過心臟的血液同樣。

這種設計是一種複雜的指令集計算（CISC）結構，雖然是單線程的，但容許單個高級指令觸發 MXU 上的多個低級操做，每次循環可能會執行 128,000 條指令，而不用訪問內存。

所以，與 GPU 陣列或者多指令集、多數據 CPU HPC 集羣相比，TPU 能夠得到巨大的性能提高和能效比率。經過評估每一個週期中 TensorFlow 流圖中每一個預備執行節點，TPU 相比其餘架構，大大減小了深度學習神經網絡訓練時間，

TensorFlow 安裝注意事項

通常來講，TensorFlow 能夠在任何支持 64 位 Python 開發環境的平臺上運行。這個環境足以訓練和測試大多數簡單的例子和教程。然而，大多數專家認爲，對於研究或專業開發，強烈推薦使用 HPC 平臺。

處理器和內存性能要求

因爲深度學習計算量很是大，所以具備向量擴展的高速多核 CPU 以及一個或多個具備高端 CUDA 支持的 GPU 是深度學習的普通標準。大多數專家還建議要注意 CPU 和 GPU 緩存，由於內存傳輸操做的能源消耗大，對性能不利。

深度學習的性能表現有兩種模式須要考慮：

開發模式。一般狀況下，在這種模式下，訓練時間、性能表現、樣本、數據集大小都會影響處理性能和內存要求。這些元素決定着神經網絡計算性能和訓練時間的極限。
應用模式。一般，在受訓過的神經網絡處理過程當中，處理性能和內存決定了分類或推測的實時性能。卷積神經網絡須要更多的低精度計算能力，而全鏈接神經網絡須要更多的內存。

虛擬機選項

用於深度學習的虛擬機（VMS）如今最適用於 CPU 爲中心多核心可用的硬件體系。由於主機操做系統控制了 CPU， GPU 這些物理設備，因此在虛擬機上實現加速很複雜。有兩種已知方法：

GPU 掛載: * 只能在 Type-1 管理程序上運行，例如 Citrix Xen， VMware ESXi， Kernel Virtual Machine，和 IBM Power。 * 掛載的開銷會根據 CPU，芯片組，管理程序和操做系統的特定組合而變化。通常來講，最新一代硬件的開銷要小得多。 * 給定的管理程序-操做系統組合支持特定的NVIDIA GPU。
GPU 虛擬化: * 支持全部的主流 GPU 供應商，好比 NVIDIA（GRID），AMD（MxGPU）和 Intel（GVT-G）。 * 在特定的新 GPU 上支持最新版本的 OpenCL（TensorFlow 沒有官方支持 OpenCL）。 * 在特定的新 GPU 上最新版本的 NVIDIA GRID 支持 CUDA 和 OpenCL。

Docker 安裝選項

在 Docker 容器或者 Kubernetes 容器集羣系統上運行 TensorFlow 有不少優點。TensorFlow 能夠將流圖做爲執行任務分發給 TensorFlow 服務器集羣，而這些服務集羣實際上是映射到容器集羣的。使用 Docker 的附加優點是 TensorFlow 服務器能夠訪問物理 GPU 核心（設備）併爲其分配特定的任務。

開發者還能夠經過安裝社區構建的 Docker 鏡像，在 PowerAI OpenPOWER 服務器上的 Kubernetes 容器集羣系統中部署 TensorFlow，如「在 OpenPOWER 服務器上使用 PowerAI 的 Kubernetes 系統進行 TensorFlow 訓練」。

雲安裝選項

TensorFlow 雲安裝有幾種選項：

Google Cloud TPU。對於研究人員來講，Google 有一個Alpha 版本的 TensorFlow Research Cloud，能夠提供在線的 TPU 實例。
Google Cloud。Google 在一些特定的區域提供了自定義的 TensorFlow 機器實例，能夠訪問一個，四個或者八個 NVIDIA GPU 設備。
IBM Cloud 數據科學與管理。IBM 提供了一個附帶 Jupyter Notebook 和 Spark 的 Python 環境。TensorFlow 已經預安裝了。
Amazon Web Services (AWS)。Amazon 提供 AWS Deep Learning Amazon 機器鏡像（AMIs)，可選 NVIDIA GPU 支持，可在各類 Amazon Elastic Compute Cloud 實例上運行。TensorFlow， Keras 和其餘的深度學習框架都已經預裝。AMI 能夠支持多達 64 個 CPU 內核和 8 個 NVIDIA GPU（K80）。
Azure。能夠在使用 Azure 容器服務的 Docker 實例上或者一個 Ubuntu 服務器上設置 TensorFlow。Azure 機器實例能夠支持 24 個 CPU內核和多達 4 個 NVIDIA GPU（M60 或 K80）。
IBM Cloud Kubernetes 集羣。IBM Clound 上的 Kubernetes 集羣能夠運行 TensorFlow。一個社區構建的 Docker 鏡像可用。POWERAI 服務器提供 GPU 支持。

TensorFlow 支持那些編程語言？

儘管 Google 在 C++ 中實現了 TensorFlow 核心代碼，可是它的主要編程語言是 Python，並且這個 API 是最完整的，最強大的，最易用的。更多有關信息，請參閱 Python API 文檔。Python API 還具備最普遍的文檔和可擴展性選項以及普遍的社區支持。

除了 Python 以外，TensorFlow還支持如下語言的 API，但不保證穩定性：

C++。TensorFlow C++ API 是下一個最強大的 API，可用於構建和執行數據流圖以及 TensorFlow 服務。更多有關 C++ API 的信息，請參閱C++ API。有關 C++ 服務 API 的更多信息，請參閱 TensorFlow 服務 API 參考。
Java 語言。儘管這個 API 是實驗性的，但最新發布的 Android Oreo 支持 TensorFlow 可能會使這個 API 更加突出。更多有關信息，請參考tensorflow.org。
Go。這個 API 是對 Google Go 語言高度實驗性的綁定。更多有關信息，請參考 package tensorflow。

第三方綁定

Google 已經定義了一個外部函數接口（FFI）來支持其餘語言綁定。該接口使用 C API 暴露了 TensorFlow C++ 核心函數。FFI 是新的，可能不會被現有的第三方綁定使用。

一項對 GitHub 的調查顯示，有如下語言的社區或供應商開發的第三方 TensorFlow 綁定 C#，Haskell， Julia，Node.js，PHP，R，Ruby，Rust 和 Scala。

Android

如今有一個通過優化的新 TensorFlow-Lite Android 庫來運行 TensorFlow 應用程序。更多有關信息，請參考 What's New in Android: O Developer Preview 2 & More。

使用 Keras 簡化 TensorFlow

Keras 的層和模型徹底兼容純粹的 TensorFlow tensor。所以，Keras 爲 TensorFlow 提供了一個很好的模型定義插件。開發者甚至能夠將 Keras 與其餘 TensorFlow 庫一塊兒使用。有關詳細信息，請參考使用 Keras 做爲 TensorFlow 的簡要接口: 教程。