原文連接node
在互聯網搜索引擎和醫療成像等諸多領域,深度神經網絡 (DNN) 應用的重要性正在不斷提高。 Pradeep Dubey 在其博文中概述了英特爾® 架構機器學習願景。 英特爾正在實現 Pradeep Dubey 博文中勾勒的機器學習願景,並正在着手開發軟件解決方案以加速執行機器學習工做負載。這些解決方案將包含在將來版本的英特爾® 數學核心函數庫(英特爾® MKL)和英特爾® 數據分析加速庫(英特爾® DAAL)中。 本技術預覽版展現了配備咱們正在開發的軟件後,英特爾平臺將有望實現的性能。 這一版本僅可在支持英特爾® 高級矢量擴展指令集 2(英特爾® AVX2)的處理器上運行。 在將來的文章中,咱們將介紹分佈式多節點配置可帶來的優點。git
本文介紹的預覽包功能有限,且並不是設計用於生產用途。 此處討論的特性現已在英特爾 MKL 2017 測試版和英特爾 Caffe 分支 (fork) 中推出。github
Caffe 是伯克利願景和學習中心 (Berkeley Vision and Learning Center, BVLC) 開發的一個深度學習框架,也是最經常使用的用於圖像識別的社區框架之一。 Caffe 一般做爲性能指標評測與 AlexNet(一種圖像識別神經網絡拓撲)和 ImageNet(一種標籤圖像數據庫)一塊兒使用。數據庫
Caffe 可充分利用英特爾 MKL 中優化的數學例程,同時也將能夠經過應用代碼現代化技術,進一步提高基於英特爾® 至強® 處理器的系統的性能。 經過合理使用英特爾 MKL、矢量化和並行化技術,相比未優化的 Caffe 方案,通過優化的方案有望將訓練性能提高 11 倍,將分類性能提高 10 倍。網絡
藉助這些優化,在整個 ILSVRC-2012 數據集上訓練 AlexNet* 網絡以在 80% 的時間實現排名前五的準確度,所需的時間從 58 天縮短至大約 5 天。架構
開始框架
咱們正努力爲軟件產品開發新功能,目前您可以使用本文附帶的技術預覽包再現展現的性能結果,甚至使用您本身的數據集訓練 AlexNet。機器學習
該預覽包支持 AlexNet 拓撲,並引入了「intel_alexnet」模型,它相似於 bvlc_alexnet,添加了 2 個全新的「IntelPack「和「IntelUnpack」層,以及優化的卷積、池化和規範化層。 此外,咱們還更改了驗證參數以提升矢量化性能,將驗證 minibatch 的數值從 50 提升到 256,將測試迭代次數從 1000 減小到 200,從而使驗證運行中使用的圖像數量保持不變。 該預覽包在如下文件中加入了 intel_alexnet 模型:分佈式
「intel_alexnet」模型支持您訓練和測試 ILSVRC-2012 訓練集。函數
開始使用該預覽包時,請確保「系統要求和限制」中列出的全部常規 Caffe 依賴項均已安裝在系統中,而後:
該預覽包與未優化的 Caffe 擁有相同的軟件依賴項:
硬件兼容性:
此軟件僅使用 AlexNet 拓撲進行了驗證,可能不適用於其餘配置。
若有關於該預覽包的任何問題和建議,請聯繫:mailto:intel.mkl@intel.com。