文件路徑:python
TensorFlow → 學習 → TensorFlow 核心 → TF 2.0 Beta → tf.data - 輸入管道API api
https://tensorflow.google.cn/beta/guide/data分佈式
該 tf.data API可以從簡單的、可重用的 pieces 中建立複雜的輸入管道complex input pipelines。ide
例如,圖像模型的管道the pipeline for an image model 能夠聚合來自分佈式文件系統的數據,對每一個圖像應用隨機擾動,並將隨機選擇的圖像合併到批處理中以進行訓練。文本模型的管道可能涉及從原始文本數據中提取符號,將它們轉換爲使用查找表嵌入標識符,以及將不一樣長度的序列批處理。學習
tf.data API 可以處理大量數據、不一樣數據格式、且可以執行復雜的轉換ui
tf.data API 引入 tf.data.Dataset 來抽象表示一系列元素a sequence of elements,其中每個元素由一個或者多個 Tensor 對象組成;如 in an image pipeline, 一個元素多是一個訓練樣本an element might be a single training example,其中一對張量表示圖像及其標籤a pair of tensors representing the image and its labelgoogle
建立數據集dataset有兩種不一樣的方法:spa
將存儲在內存中的一個或者多個文件數據造成的數據源構建成數據集Datasetcode
將一個或者多個tf.data.Dataset對象經過數據轉換構建成數據集Dataset
對象
之後有時間繼續補充學習,來自:https://tensorflow.google.cn/beta/guide/data