Tengine-Lite v1.0 版本更新啦!!!重要的事情要打三個感嘆號!!!
小O妹和組員肝了不知多少個日日夜夜,這期間被催促,被質疑,小O妹都堅強的挺了過來。上線的那一刻差點哇的哭出來。git
更新內容以下:
新特性:
a. Tengine-Lite開源異構計算切圖功能,本版本支持CPU+GPU異構,後續版本敬請期待CPU+NPU (閒來大佬主刀(*❦ω❦),咱們會開個專門的話題來給你們詳細講一講實現方式)github
b. 新增armv8.2 fp16精度推理,支持fp32/fp16混合精度模式性能優化
c. Tengine-Lite支持Vulkan GPU(適配高通/NV Xavier/x86獨立GPU等),終於支持Vulkan了,撒花~網絡
example:MobileNet + MobilenetSSD(CPU GPU異構)
d. Tengine-Lite支持Arm Mali GPU(ACL)多線程
example:MobileNet + MobilenetSSD(CPU GPU異構)
e.C++ API(實驗性支持)函數
f.Python API(實驗性支持)工具
新網絡支持:
- landmark
- yolact
- openpose
- yolov4
新算子支持:
a. 新增UINT8 算子ref,小夥伴們能夠結合咱們的全套模型轉換工具、量化工具,在x8六、arm平臺上驗證一下流程啦~雖然速度還不算快,不過這裏給你們埋(wa)個(ge)伏筆(keng),UINT8在哪裏跑的快呢~性能
- concat
- clip
- convolution
- detection_out
- dropout
- eltwise
- fc
- flatten
- pooling
- premute
- priorbox
- reshape
- softmax
支持模型UINT8格式模型 MobileNetv一、SqueezeNetv1.一、ResNet1八、ResNet50、GoogleNet、VGG1六、MobileNetv二、Inceptionv三、MobileNetSSD
b. 新增Mish激活函數優化
推理性能:
a. arm多線程推理性能優化(openmp)spa
b. x86性能算子優化
GitHub連接以下,歡迎你們Watch,star,Fork三連支持