Free and open source mobile deep learning framework, deploying by Baidu.android
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.ios
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)
百度研發的移動端深度學習框架,致力於讓卷積神經網絡極度簡單的部署在手機端。目前正在手機百度內運行。支持iOS gpu計算。體積小,速度快。git
體積 armv7 340k+
速度 iOS GPU mobilenet 能夠達到 40ms、squeezenet 能夠達到 30msgithub
項目地址:https://github.com/baidu/mobile-deep-learning算法
更多機器學習教程:http://www.tensorflownews.com網絡
特徵框架
一鍵部署,腳本參數就能夠切換ios或者android
支持iOS gpu運行MobileNet、squeezenet模型
已經測試過能夠穩定運行MobileNet、GoogLeNet v一、squeezenet模型
體積極小,無任何第三方依賴。純手工打造。
提供量化腳本,對32位float轉8位uint直接支持,模型體積量化後4M上下
與ARM相關算法團隊線上線下屢次溝通,針對ARM平臺會持續優化
NEON使用涵蓋了卷積、歸一化、池化全部方面的操做
彙編優化,針對寄存器彙編操做具體優化
loop unrolling 循環展開,爲提高性能減小沒必要要的CPU消耗,所有展開判斷操做
將大量繁重的計算任務前置到overhead過程機器學習