Tensorflow之MNIST解析

時間 2019-11-14

標籤 tensorflow mnist 解析简体版

原文原文鏈接

要說2017年什麼技術最火爆，無疑是google領銜的深度學習開源框架Tensorflow。本文簡述一下深度學習的入門例子MNIST。html

深度學習簡單介紹

首先要簡單區別幾個概念：人工智能，機器學習，深度學習，神經網絡。這幾個詞應該是出現的最爲頻繁的，可是他們有什麼區別呢？python

人工智能：人類經過直覺能夠解決的問題，如：天然語言理解，圖像識別，語音識別等，計算機很難解決，而人工智能就是要解決這類問題。git

機器學習：若是一個任務能夠在任務T上，隨着經驗E的增長，效果P也隨之增長，那麼就認爲這個程序能夠從經驗中學習。算法

深度學習：其核心就是自動將簡單的特徵組合成更加複雜的特徵，並用這些特徵解決問題。數組

神經網絡：最初是一個生物學的概念，通常是指大腦神經元，觸點，細胞等組成的網絡，用於產生意識，幫助生物思考和行動，後來人工智能受神經網絡的啓發，發展出了人工神經網絡。網絡

來一張圖就比較清楚了，以下圖：框架

MNIST解析

MNIST是深度學習的經典入門demo，他是由6萬張訓練圖片和1萬張測試圖片構成的，每張圖片都是28*28大小（以下圖），並且都是黑白色構成（這裏的黑色是一個0-1的浮點數，黑色越深表示數值越靠近1），這些圖片是採集的不一樣的人手寫從0到9的數字。TensorFlow將這個數據集和相關操做封裝到了庫中，下面咱們來一步步解讀深度學習MNIST的過程。機器學習

上圖就是4張MNIST圖片。這些圖片並非傳統意義上的png或者jpg格式的圖片，由於png或者jpg的圖片格式，會帶有不少干擾信息（如：數據塊，圖片頭，圖片尾，長度等等），這些圖片會被處理成很簡易的二維數組，如圖：函數

能夠看到，矩陣中有值的地方構成的圖形，跟左邊的圖形很類似。之因此這樣作，是爲了讓模型更簡單清晰。特徵更明顯。學習

咱們先看模型的代碼以及如何訓練模型：

  mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)
# x是特徵值
  x = tf.placeholder(tf.float32, [None, 784])
# w表示每個特徵值（像素點）會影響結果的權重
  W = tf.Variable(tf.zeros([784, 10]))
  b = tf.Variable(tf.zeros([10]))
  y = tf.matmul(x, W) + b
# 是圖片實際對應的值
  y_ = tf.placeholder(tf.float32, [None, 10])

  cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))
  train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
  sess = tf.InteractiveSession()
  tf.global_variables_initializer().run()
  # mnist.train 訓練數據
  for _ in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

  #取得y得最大機率對應的數組索引來和y_的數組索引對比，若是索引相同，則表示預測正確
  correct_prediction = tf.equal(tf.arg_max(y, 1), tf.arg_max(y_, 1))
  accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

  print(sess.run(accuracy, feed_dict={x: mnist.test.images,
                                       y_: mnist.test.labels}))

首先第一行是獲取MNIST的數據集，咱們逐一解釋一下：

x（圖片的特徵值）：這裏使用了一個28*28=784列的數據來表示一個圖片的構成，也就是說，每個點都是這個圖片的一個特徵，這個其實比較好理解，由於每個點都會對圖片的樣子和表達的含義有影響，只是影響的大小不一樣而已。至於爲何要將28*28的矩陣攤平成爲一個1行784列的一維數組，我猜想多是由於這樣作會更加簡單直觀。

W（特徵值對應的權重）：這個值很重要，由於咱們深度學習的過程，就是發現特徵，通過一系列訓練，從而得出每個特徵對結果影響的權重，咱們訓練，就是爲了獲得這個最佳權重值。

b（偏置量）：是爲了去線性話（我不是太清楚爲何須要這個值）

y（預測的結果）：單個樣本被預測出來是哪一個數字的機率，好比：有可能結果是[ 1.07476616 -4.54194021 2.98073649 -7.42985344 3.29253793 1.96750617 8.59438515 -6.65950203 1.68721473 -0.9658531 ]，則分別表示是0，1，2，3，4，5，6，7，8，9的機率，而後會取一個最大值來做爲本次預測的結果，對於這個數組來講，結果是6（8.59438515）

y_（真實結果）：來自MNIST的訓練集，每個圖片所對應的真實值，若是是6，則表示爲：[0 0 0 0 0 1 0 0 0]

再下面兩行代碼是損失函數（交叉熵）和梯度降低算法，經過不斷的調整權重和偏置量的值，來逐步減少根據計算的預測結果和提供的真實結果之間的差別，以達到訓練模型的目的。

算法肯定之後即可以開始訓練模型了，以下：

for _ in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

mnist.train.next_batch(100)是從訓練集裏一次提取100張圖片數據來訓練，而後循環1000次，以達到訓練的目的。

以後的兩行代碼都有註釋，再也不累述。咱們看最後一行代碼：

print(sess.run(accuracy, feed_dict={x: mnist.test.images,
                                       y_: mnist.test.labels}))

mnist.test.images和mnist.test.labels是測試集，用來測試。accuracy是預測準確率。

當代碼運行起來之後，咱們發現，準確率大概在92%左右浮動。這個時候咱們可能想看看究竟是什麼樣的圖片讓預測不許。則添加以下代碼：

  for i in range(0, len(mnist.test.images)):
    result = sess.run(correct_prediction, feed_dict={x: np.array([mnist.test.images[i]]), y_: np.array([mnist.test.labels[i]])})
    if not result:
      print('預測的值是：',sess.run(y, feed_dict={x: np.array([mnist.test.images[i]]), y_: np.array([mnist.test.labels[i]])}))
      print('實際的值是：',sess.run(y_,feed_dict={x: np.array([mnist.test.images[i]]), y_: np.array([mnist.test.labels[i]])}))
      one_pic_arr = np.reshape(mnist.test.images[i], (28, 28))
      pic_matrix = np.matrix(one_pic_arr, dtype="float")
      plt.imshow(pic_matrix)
      pylab.show()
      break

  print(sess.run(accuracy, feed_dict={x: mnist.test.images,
                                       y_: mnist.test.labels}))

for循環內指明一旦result爲false，就表示出現了預測值和實際值不符合的圖片，而後咱們把值和圖片分別打印出來看看：

預測的值是： [[ 1.82234347 -4.87242508 2.63052988 -6.56350136 2.73666072 2.30682945 8.59051228 -7.20512581 1.45552373 -0.90134078]]

對應的是數字6。
實際的值是： [[ 0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]]

對應的是數字5。

咱們再來看看圖片是什麼樣子的：

的確像5又像6。

整體來講，只有92%的準確率，仍是比較低的，後續會解析一下比較適合識別圖片的卷積神經網絡，準確率能夠達到99%以上。

一些體會與感想

我本人是一名iOS開發，也是迎着人工智能的浪潮開始一路學習，我以爲人工智能終將改變咱們的生活，也會成爲將來的一個熱門學科。這一個多月的自學下來，我以爲最爲困難的是克服本身的畏難情緒，由於我徹底沒有AI方面的任何經驗，並且工做年限過久，線性代數，機率論等知識早已還給老師，因此在開始的時候，老是反反覆覆不停猶豫，糾結到底要不要把時間花費在研究深度學習上面。可是後來一想，假如我不學AI的東西，若干年後，AI發展愈加成熟，到時候想學也會難以跟上步伐，並且，讓電腦學會思考這自己就是一件很讓人興奮的事情，既然想學，有什麼理由不去學呢？與你們共勉。

參考文章：

https://zhuanlan.zhihu.com/p/25482889

https://hit-scir.gitbooks.io/neural-networks-and-deep-learning-zh_cn/content/chap1/c1s0.html

1. tensorflow開發之mnist文件解析
2. tensorflow 之 mnist
3. Tensorflow之訓練MNIST（1）
4. tensorflow mnist分類
5. tensorflow mnist read_data_sets fails
6. tensorflow MNIST softmax 實戰
7. tensorflow cnn mnist分類
8. 2、TensorFlow訓練MNIST
9. Tensorflow的MNIST手寫
10. 用TensorFlow實現MNIST
更多相關文章...
• XML DOM 解析器 - XML DOM 教程
• TCP報文格式解析 - TCP/IP教程
• 互聯網組織的未來：剖析GitHub員工的任性之源
• Scala 中文亂碼解決

相關標籤/搜索

mnist

android+tensorflow+cnn+mnist

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。