Tengine-Lite v1.0 版本更新

Tengine-Lite v1.0 版本更新啦!!!重要的事情要打三個感嘆號!!!

小O妹和組員肝了不知多少個日日夜夜,這期間被催促,被質疑,小O妹都堅強的挺了過來。上線的那一刻差點哇的哭出來。git

更新內容以下:

新特性:

a. Tengine-Lite開源異構計算切圖功能,本版本支持CPU+GPU異構,後續版本敬請期待CPU+NPU (閒來大佬主刀(*❦ω❦),咱們會開個專門的話題來給你們詳細講一講實現方式)github

b. 新增armv8.2 fp16精度推理,支持fp32/fp16混合精度模式性能優化

c. Tengine-Lite支持Vulkan GPU(適配高通/NV Xavier/x86獨立GPU等),終於支持Vulkan了,撒花~網絡

example:MobileNet + MobilenetSSD(CPU GPU異構)

d. Tengine-Lite支持Arm Mali GPU(ACL)多線程

example:MobileNet + MobilenetSSD(CPU GPU異構)

e.C++ API(實驗性支持)函數

f.Python API(實驗性支持)工具

新網絡支持:

  • landmark
  • yolact
  • openpose
  • yolov4

新算子支持:

a. 新增UINT8 算子ref,小夥伴們能夠結合咱們的全套模型轉換工具、量化工具,在x8六、arm平臺上驗證一下流程啦~雖然速度還不算快,不過這裏給你們埋(wa)個(ge)伏筆(keng),UINT8在哪裏跑的快呢~性能

  • concat
  • clip
  • convolution
  • detection_out
  • dropout
  • eltwise
  • fc
  • flatten
  • pooling
  • premute
  • priorbox
  • reshape
  • softmax
支持模型UINT8格式模型 MobileNetv一、SqueezeNetv1.一、ResNet1八、ResNet50、GoogleNet、VGG1六、MobileNetv二、Inceptionv三、MobileNetSSD

b. 新增Mish激活函數優化

推理性能:

a. arm多線程推理性能優化(openmp)spa

b. x86性能算子優化

GitHub連接以下,歡迎你們Watch,star,Fork三連支持

https://github.com/OAID/Tengine

相關文章
相關標籤/搜索