MindSpore手寫數字識別初體驗，深度學習也沒那麼神祕嘛

時間 2020-11-30

標籤算法 segmentfault 網絡框架機器學習學習測試 spa 翻譯 blog 欄目系統網絡简体版

原文原文鏈接

摘要：想了解深度學習卻又無從下手，不如從手寫數字識別模型訓練開始吧！

深度學習做爲機器學習分支之一，應用日益普遍。語音識別、自動機器翻譯、即時視覺翻譯、刷臉支付、人臉考勤……不知不覺，深度學習已經滲入到咱們生活中的每一個角落，給生活帶來極大便利。即使如此，依然有不少人以爲深度學習高深莫測、高不可攀，的確，它有深奧之處，非專業人士難以企及，但也有親和力十足的一面，讓沒有基礎的小白也能輕鬆上手，感覺深度學習的魅力，接下來要介紹的手寫數字識別模型訓練正是如此。算法

手寫數字識別初探

手寫數字識別是計算機視覺中較爲簡單的任務，也是計算機視覺領域發展較早的方向之一，早期主要用於銀行匯款、單號識別、郵政信件、包裹的手寫、郵編識別等場景，目前手寫數字識別已經達到了較高的準確率，獲得大規模的推廣與應用。雖然手寫數字識別自己的領域比較狹窄，實用性有限，可是在它基礎上發展起來的卷積神經網絡等計算機視覺技術早已應用在更爲複雜的任務中，所以，手寫數字識別也成爲計算機視覺領域衡量算法表現的一個基準任務。因此，經過這一實踐場景來了解神經網絡開發和訓練，可謂再好不過了。如何使用深度學習框架MindSpore進行模型開發與訓練？又如何在ModelArts平臺訓練一個能夠用於識別手寫數字的模型呢？讓咱們來一探究竟吧。segmentfault

數據集的選擇與準備

機器學習中的傳統機器學習和深度學習都是數據驅動的研究領域，須要基於大量的歷史數據對模型進行訓練，再使用模型對新的數據進行推理和預測，所以數據是機器學習中的關鍵要素之一。網絡

MNIST數據集是目前手寫數字識別領域使用最爲普遍的公開數據集，大部分識別算法都會基於它進行訓練和驗證。MNIST數據集包含0~9這10種數字，每一種數字都包含大量不一樣形態的手寫數字圖片訓練集，分爲訓練集和測試集。訓練集涵蓋6萬張手寫數字圖片，測試級涵蓋1萬張手寫數字圖片。每一張圖片皆爲通過尺寸標準化的黑白圖像，是28*28像素，像素值爲0或者1的二值化圖像。MNIST數據集的原始圖像是黑白的，但在實際訓練中使用數據加強後的圖片可以得到更好的訓練效果。框架

本次訓練所使用的通過數據加強的圖片機器學習

基於深度學習的識別方法

與傳統的機器學習使用簡單模型執行分類等任務不一樣，這次訓練咱們使用深度神經網絡做爲訓練模型，即深度學習。深度學習經過人工神經網絡來提取特徵，不一樣層的輸出常被視爲神經網絡提取出的不一樣尺度的特徵，上一層的輸出做爲下一層的輸入，層層鏈接構成深度神經網絡。學習

深度學習工做原理測試

1994年，Yann LeCun發佈告終合反向傳播的卷積神經網絡 LeNet，其在手寫數字識別領域效果遠超其餘模型。1998年，Yann LeCun等人構建的卷積神經網絡LeNet-5在手寫數字識別問題中取得成功，被譽爲卷積神經網絡的「Hello Word」。LeNet-5以及在此以後產生的變體定義了現代卷積神經網絡的基本結構，可謂入門級神經網絡模型。本次實踐使用的模型正是LeNet-5。spa

LeNet-5結構翻譯

LeNet-5由輸入層、卷積層、池化層和全鏈接層組成。輸入層用於輸入數據；卷積層經過卷積運算對輸入進行局部特徵提取；池化層經過下采樣的方式下降特徵圖的分辨率，從而下降輸出對位置和形變的敏感度，同時還可下降網絡中的參數和計算量；全鏈接層將局部特徵經過權值矩陣組裝成完整的圖像，完成特徵空間到真實類別空間的映射，最終的圖像分類即是由全鏈接層完成的。有了這樣一個神經網絡後，咱們還須要用大量數據集對它進行不斷地訓練，才能對輸入數據有較爲準確的預測結果，這一過程便依賴於華爲自研的深度學習框架MindSpore。blog

MindSpore的「學習」過程

MindSpore當前已經部署在ModelArts的開發環境和訓練環境中，同時提供了閾值算法供開發者直接使用，它的學習過程以下圖所示，簡單總結一下：

使用MindSpore提供的基本模塊進行前線網絡開發
對數據進行處理和加強以便獲得更好的數據輸入
利用前線網絡構建訓練模型，並進行模型保存和推理

提及來可能平淡無奇，可是實驗終究須要本身親自動手才能體會其中的無限樂趣。

看到這裏，想必各類背景知識和原理你們已經略知一二，若是你已經躍躍欲試，那就快來華爲雲學院學習微認證課程《使用MindSpore訓練手寫數字識別模型》吧。對了，悄悄告訴你，這個實驗如今仍是免費的喲，來華爲雲學院沙箱實驗室就能即刻體驗。從原理到實踐，帶你全方位瞭解手寫數字模型訓練全過程，快速上手深度學習，速來！

→點擊直達華爲雲學院，get更多新技能