TensorRT 直接支持的model有ONNX、Caffe、TensorFlow,其餘常見model建議先轉化成ONNX。總結以下:html
1 ONNX(.onnx) python
2 Keras(.h5) --> ONNX(.onnx) (https://github.com/onnx/keras-onnx)git
3 Caffe(.caffemodel)github
4 Darknet(.cfg) --> ONNX(.onnx) (Our tutorial : yolo-v3)api
5 TensorFlow(.uff)網絡
2、TensorRT支持的常見運算:ide
Activation(激活函數)、Convolution(卷積運算)、Deconvolution(反捲積運算)、FullConnected(全鏈接)、Padding(填充)、Pooling(池化)、RNN(遞歸神經網絡)、SoftMax()等。函數
更詳細的API可參考:性能
yolo3由CNN網絡和detection模塊組成,TensorRT只對CNN網絡進行Inference加速。即:
TensorRT input is:608*608 image
TensorRT output is:array
(array[0].shape = 255 *19*19、
array[1].shape = 255*38*38、
array[2].shape = 255 *76*76)
具體實現過程:
1 Darknet(.cfg) --> ONNX(.onnx)
2 ONNX(.onnx) --> TensorRT model(.trt)
3 TensorRT加速CNN部分,執行detection模塊獲得最終結果。
pytorch-yolo3:https://github.com/ayooshkathuria/pytorch-yolo-v3
本項目地址:https://github.com/Cw-zero/TensorRT_yolo3
(注:本項目是對pytorch-yolo3進行改寫加速的)
More about TensorRT 可參考官方指導:
原文出處:https://www.cnblogs.com/justcoder/p/10428100.html