Google機器學習筆記(七)TF.Learn 手寫文字識別

轉載請註明做者:夢裏風林
Google Machine Learning Recipes 7
官方中文博客 - 視頻地址
Github工程地址 https://github.com/ahangchen/GoogleML
歡迎Star,也歡迎到Issue區討論html

mnist問題

  • 計算機視覺領域的Hello world
  • 給定55000個圖片,處理成28*28的二維矩陣,矩陣中每一個值表示一個像素點的灰度,做爲feature
  • 給定每張圖片對應的字符,做爲label,總共有10個label,是一個多分類問題

TensorFlow

  • 能夠按教程用Docker安裝,也能夠直接在Linux上安裝
  • 你可能會擔憂,不用Docker的話怎麼開那個notebook呢?其實notebook就在主講人的Github頁
  • 能夠用這個Chrome插件:npviewer直接在瀏覽器中閱讀ipynb格式的文件,而不用在本地啓動iPython notebook
  • 咱們的教程在這裏:ep7.ipynb
  • 把代碼從ipython notebook中整理出來:tflearn_mnist.py

代碼分析

  • 下載數據集
mnist = learn.datasets.load_dataset('mnist')

恩,就是這麼簡單,一行代碼下載解壓mnist數據,每一個img已經灰度化成長784的數組,每一個label已經one-hot成長度10的數組python

在個人深度學習筆記看One-hot是什麼東西git

  • numpy讀取圖像到內存,用於後續操做,包括訓練集(只取前10000個)和驗證集
data = mnist.train.images
labels = np.asarray(mnist.train.labels, dtype=np.int32)
test_data = mnist.test.images
test_labels = np.asarray(mnist.test.labels, dtype=np.int32)
max_examples = 10000
data = data[:max_examples]
labels = labels[:max_examples]
  • 可視化圖像
def display(i):
    img = test_data[i]
    plt.title('Example %d. Label: %d' % (i, test_labels[i]))
    plt.imshow(img.reshape((28, 28)), cmap=plt.cm.gray_r)
    plt.show()

用matplotlib展現灰度圖github

  • 訓練分類器
    • 提取特徵(這裏每一個圖的特徵就是784個像素值)
feature_columns = learn.infer_real_valued_columns_from_input(data)
  • 建立線性分類器並訓練
classifier = learn.LinearClassifier(feature_columns=feature_columns, n_classes=10)
classifier.fit(data, labels, batch_size=100, steps=1000)

注意要制定n_classes爲labels的數量web

  • 分類器其實是在根據每一個feature判斷每一個label的可能性,
  • 不一樣的feature有的重要,有的不重要,因此須要設置不一樣的權重
  • 一開始權重都是隨機的,在fit的過程當中,實際上就是在調整權重

  • 最後可能性最高的label就會做爲預測輸出chrome

  • 傳入測試集,預測,評估分類效果docker

result = classifier.evaluate(test_data, test_labels)
print result["accuracy"]

速度很是快,並且準確率達到91.4%數組

能夠只預測某張圖,並查看預測是否跟實際圖形一致瀏覽器

# here's one it gets right
print ("Predicted %d, Label: %d" % (classifier.predict(test_data[0]), test_labels[0]))
display(0)
# and one it gets wrong
print ("Predicted %d, Label: %d" % (classifier.predict(test_data[8]), test_labels[8]))
display(8)
  • 可視化權重以瞭解分類器的工做原理
weights = classifier.weights_
a.imshow(weights.T[i].reshape(28, 28), cmap=plt.cm.seismic)

  • 這裏展現了8個張圖中,每一個像素點(也就是feature)的weights,
  • 紅色表示正的權重,藍色表示負的權重
  • 做用越大的像素,它的顏色越深,也就是權重越大
  • 因此權重中紅色部分幾乎展現了正確的數字

Next steps

相關文章
相關標籤/搜索