使用 TensorFlow, 你必須明白 TensorFlow:html
會話 (Session)
的上下文 (context) 中執行圖.變量 (Variable)
維護狀態.TensorFlow 是一個編程系統, 使用圖來表示計算任務. 圖中的節點被稱之爲 op (operation 的縮寫). 一個 op 得到 0 個或多個 Tensor
, 執行計算, 產生 0 個或多個 Tensor
. 每一個 Tensor 是一個類型化的多維數組. 例如, 你能夠將一小組圖像集表示爲一個四維浮點數數組, 這四個維度分別是 [batch, height, width, channels]
.python
一個 TensorFlow 圖描述了計算的過程. 爲了進行計算, 圖必須在 會話
裏被啓動. 會話
將圖的 op 分發到諸如 CPU 或 GPU 之類的 設備
上, 同時提供執行 op 的方法. 這些方法執行後, 將產生的 tensor 返回. 在 Python 語言中, 返回的 tensor 是 numpy ndarray
對象; 在 C 和 C++ 語言中, 返回的 tensor 是 tensorflow::Tensor
實例.git
TensorFlow 程序一般被組織成一個構建階段和一個執行階段. 在構建階段, op 的執行步驟 被描述成一個圖. 在執行階段, 使用會話執行執行圖中的 op.github
例如, 一般在構建階段建立一個圖來表示和訓練神經網絡, 而後在執行階段反覆執行圖中的訓練 op.編程
TensorFlow 支持 C, C++, Python 編程語言. 目前, TensorFlow 的 Python 庫更加易用, 它提供了大量的輔助函數來簡化構建圖的工做, 這些函數還沒有被 C 和 C++ 庫支持.api
三種語言的會話庫 (session libraries) 是一致的.數組
構建圖的第一步, 是建立源 op (source op). 源 op 不須要任何輸入, 例如 常量 (Constant)
. 源 op 的輸出被傳遞給其它 op 作運算.網絡
Python 庫中, op 構造器的返回值表明被構造出的 op 的輸出, 這些返回值能夠傳遞給其它 op 構造器做爲輸入.session
TensorFlow Python 庫有一個默認圖 (default graph), op 構造器能夠爲其增長節點. 這個默認圖對 許多程序來講已經足夠用了. 閱讀 Graph 類 文檔 來了解如何管理多個圖.數據結構
import tensorflow as tf # 建立一個常量 op, 產生一個 1x2 矩陣. 這個 op 被做爲一個節點 # 加到默認圖中. # # 構造器的返回值表明該常量 op 的返回值. matrix1 = tf.constant([[3., 3.]]) # 建立另一個常量 op, 產生一個 2x1 矩陣. matrix2 = tf.constant([[2.],[2.]]) # 建立一個矩陣乘法 matmul op , 把 'matrix1' 和 'matrix2' 做爲輸入. # 返回值 'product' 表明矩陣乘法的結果. product = tf.matmul(matrix1, matrix2)
默認圖如今有三個節點, 兩個 constant()
op, 和一個matmul()
op. 爲了真正進行矩陣相乘運算, 並獲得矩陣乘法的 結果, 你必須在會話裏啓動這個圖.
構造階段完成後, 才能啓動圖. 啓動圖的第一步是建立一個 Session
對象, 若是無任何建立參數, 會話構造器將啓動默認圖.
欲瞭解完整的會話 API, 請閱讀Session 類.
# 啓動默認圖. sess = tf.Session() # 調用 sess 的 'run()' 方法來執行矩陣乘法 op, 傳入 'product' 做爲該方法的參數. # 上面提到, 'product' 表明了矩陣乘法 op 的輸出, 傳入它是向方法代表, 咱們但願取回 # 矩陣乘法 op 的輸出. # # 整個執行過程是自動化的, 會話負責傳遞 op 所需的所有輸入. op 一般是併發執行的. # # 函數調用 'run(product)' 觸發了圖中三個 op (兩個常量 op 和一個矩陣乘法 op) 的執行. # # 返回值 'result' 是一個 numpy `ndarray` 對象. result = sess.run(product) print result # ==> [[ 12.]] # 任務完成, 關閉會話. sess.close()
Session
對象在使用完後須要關閉以釋放資源. 除了顯式調用 close 外, 也可使用 "with" 代碼塊 來自動完成關閉動做.
with tf.Session() as sess: result = sess.run([product]) print result
在實現上, TensorFlow 將圖形定義轉換成分佈式執行的操做, 以充分利用可用的計算資源(如 CPU 或 GPU). 通常你不須要顯式指定使用 CPU 仍是 GPU, TensorFlow 能自動檢測. 若是檢測到 GPU, TensorFlow 會盡量地利用找到的第一個 GPU 來執行操做.
若是機器上有超過一個可用的 GPU, 除第一個外的其它 GPU 默認是不參與計算的. 爲了讓 TensorFlow 使用這些 GPU, 你必須將 op 明確指派給它們執行. with...Device
語句用來指派特定的 CPU 或 GPU 執行操做:
with tf.Session() as sess: with tf.device("/gpu:1"): matrix1 = tf.constant([[3., 3.]]) matrix2 = tf.constant([[2.],[2.]]) product = tf.matmul(matrix1, matrix2) ...
設備用字符串進行標識. 目前支持的設備包括:
"/cpu:0"
: 機器的 CPU."/gpu:0"
: 機器的第一個 GPU, 若是有的話."/gpu:1"
: 機器的第二個 GPU, 以此類推.閱讀使用GPU章節, 瞭解 TensorFlow GPU 使用的更多信息.
文檔中的 Python 示例使用一個會話 Session
來 啓動圖, 並調用 Session.run()
方法執行操做.
爲了便於使用諸如 IPython 之類的 Python 交互環境, 可使用 InteractiveSession
代替 Session
類, 使用 Tensor.eval()
和 Operation.run()
方法代替 Session.run()
. 這樣能夠避免使用一個變量來持有會話.
# 進入一個交互式 TensorFlow 會話. import tensorflow as tf sess = tf.InteractiveSession() x = tf.Variable([1.0, 2.0]) a = tf.constant([3.0, 3.0]) # 使用初始化器 initializer op 的 run() 方法初始化 'x' x.initializer.run() # 增長一個減法 sub op, 從 'x' 減去 'a'. 運行減法 op, 輸出結果 sub = tf.sub(x, a) print sub.eval() # ==> [-2. -1.]
TensorFlow 程序使用 tensor 數據結構來表明全部的數據, 計算圖中, 操做間傳遞的數據都是 tensor. 你能夠把 TensorFlow tensor 看做是一個 n 維的數組或列表. 一個 tensor 包含一個靜態類型 rank, 和 一個 shape. 想了解 TensorFlow 是如何處理這些概念的, 參見 Rank, Shape, 和 Type.
Variables for more details. 變量維護圖執行過程當中的狀態信息. 下面的例子演示瞭如何使用變量實現一個簡單的計數器. 參見 變量 章節瞭解更多細節.
# 建立一個變量, 初始化爲標量 0. state = tf.Variable(0, name="counter") # 建立一個 op, 其做用是使 state 增長 1 one = tf.constant(1) new_value = tf.add(state, one) update = tf.assign(state, new_value) # 啓動圖後, 變量必須先通過`初始化` (init) op 初始化, # 首先必須增長一個`初始化` op 到圖中. init_op = tf.initialize_all_variables() # 啓動圖, 運行 op with tf.Session() as sess: # 運行 'init' op sess.run(init_op) # 打印 'state' 的初始值 print sess.run(state) # 運行 op, 更新 'state', 並打印 'state' for _ in range(3): sess.run(update) print sess.run(state) # 輸出: # 0 # 1 # 2 # 3
代碼中 assign()
操做是圖所描繪的表達式的一部分, 正如 add()
操做同樣. 因此在調用 run()
執行表達式以前, 它並不會真正執行賦值操做.
一般會將一個統計模型中的參數表示爲一組變量. 例如, 你能夠將一個神經網絡的權重做爲某個變量存儲在一個 tensor 中. 在訓練過程當中, 經過重複運行訓練圖, 更新這個 tensor.
爲了取回操做的輸出內容, 能夠在使用 Session
對象的 run()
調用 執行圖時, 傳入一些 tensor, 這些 tensor 會幫助你取回結果. 在以前的例子裏, 咱們只取回了單個節點 state
, 可是你也能夠取回多個 tensor:
input1 = tf.constant(3.0) input2 = tf.constant(2.0) input3 = tf.constant(5.0) intermed = tf.add(input2, input3) mul = tf.mul(input1, intermed) with tf.Session() as sess: result = sess.run([mul, intermed]) print result # 輸出: # [array([ 21.], dtype=float32), array([ 7.], dtype=float32)]
須要獲取的多個 tensor 值,在 op 的一次運行中一塊兒得到(而不是逐個去獲取 tensor)。
上述示例在計算圖中引入了 tensor, 以常量或變量的形式存儲. TensorFlow 還提供了 feed 機制, 該機制 能夠臨時替代圖中的任意操做中的 tensor 能夠對圖中任何操做提交補丁, 直接插入一個 tensor.
feed 使用一個 tensor 值臨時替換一個操做的輸出結果. 你能夠提供 feed 數據做爲 run()
調用的參數. feed 只在調用它的方法內有效, 方法結束, feed 就會消失. 最多見的用例是將某些特殊的操做指定爲 "feed" 操做, 標記的方法是使用 tf.placeholder() 爲這些操做建立佔位符.
input1 = tf.placeholder(tf.float32) input2 = tf.placeholder(tf.float32) output = tf.mul(input1, input2) with tf.Session() as sess: print sess.run([output], feed_dict={input1:[7.], input2:[2.]}) # 輸出: # [array([ 14.], dtype=float32)]
for a larger-scale example of feeds. 若是沒有正確提供 feed, placeholder()
操做將會產生錯誤. MNIST 全連通 feed 教程 (source code) 給出了一個更大規模的使用 feed 的例子.