點擊上方「AI算法與圖像處理」,選擇加"星標"或「置頂」git
重磅乾貨,第一時間送達github
來源:Opencv中文網
web
論文已在後臺設置,爲了不爆滿形成的下載問題,小夥伴能夠在後臺回覆 「 YOLOv4 」,便可收到論文下載
YOLOv4 沒有理論創新,而是在原有YOLO目標檢測架構的基礎上增長了近年CNN改進的衆多技術,從數據處理到網絡訓練再到損失函數,遵行「拿來主義」,加上漂亮的工程實踐,打造實現最佳速度與精度平衡的目標檢測新基準!算法
在MS COCO 數據集 實現 43.5% AP (65.7% AP50 ), 速度也更快了,在Tesla V100 GPU上 ∼65 FPS!微信
上圖爲YOLOv4與其餘SOTA目標檢測算法的比較,在精度差很少的狀況下YOLOv4比EfficientDet快兩倍,而相對於YOLOv3 AP和FPS 分別提高了10%和12%!網絡
做者首先對現有目標檢測方法進行了總結,不管是one-stage 、two-stage 仍是 anchor free 、anchor based,均包含 Input、Backbone 、Neck、Heads(Dense Prediction或者Sparse Prediction)四部分。架構
目前各部分的主流技術包括:app
而後做者對現有目標檢測相關技術的進展作了總結,即大禮包「bag of freebies」和特價袋「Bag of specials」。編輯器
bag of freebies 指那些可以提升精度而不增長推斷時間的技術。好比數據增廣的方法圖像幾何變換、CutOut、grid mask等,網絡正則化的方法DropOut、DropBlock等,類別不平衡的處理方法、難例挖掘方法、損失函數的設計等。函數
-
bag of specials 是指那些增長稍許推斷代價,但能夠提升模型精度的方法,好比增大模型感覺野的SPP、ASPP、RFB等,引入注意力機制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等 ,特徵集成方法SFAM , ASFF , BiFPN等,改進的激活函數Swish、Mish等,或者是後處理方法如soft NMS、DIoU NMS等
架構選擇:
通過綜合考慮計算量和精度,做者最終選擇的架構是:CSPDarknet53 做爲 backbone, SPP 模塊用於增大感覺野, PANet 用做 neck, 並仍沿襲 YOLOv3(anchor based) head。
做者在MS COCO 數據集上進行了實驗,結果以下:
每一行分別表明不一樣的GPU計算結果:
在主流的SOTA目標檢測算法中,YOLOv4實現了最佳的速度和精度的平衡,
在精度差很少的狀況下,YOLOv4的速度每每是最快的,
尤爲在FPS超過30的實時算法中,YOLOv4是精度最高的。
由於不一樣的算法公佈時可能在不一樣的GPU上進行測試,做者根據不一樣的GPU(Maxwell/Pascal/Volta)分別列出了YOLOv4與其餘算法的更詳細的比較,即Table 八、九、10,幀率大於等於30的用藍底標出。
可見YOLOv4 在實時目標檢測算法中精度最高,實現了精度和速度的最佳平衡。
論文地址:
雖然YOLOv4在理論上沒有創新,但其引人注目的精度速度,承襲YOLO系列的簡單易上手的操做體驗,必將成爲實時目標檢測的口碑之做!
end
![](http://static.javashuo.com/static/loading.gif)
![](http://static.javashuo.com/static/loading.gif)
本文分享自微信公衆號 - AI算法與圖像處理(AI_study)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。