http://www.dengfanxin.cn/?p=423git
原文地址github
本文實現了Fast-RCNN主要部分的翻譯工做,在SPPnet出來以後,同在微軟的R-CNN的做者Ross迅速懟了回去,拋出了更快更好的Fast-RCNN,思路爲之一新的是,將以前的多階段訓練合併成了單階段訓練,此次的工做簡潔漂亮,相比以前的RCNN,懷疑做者是在擠牙膏。另外,面對靈活尺寸問題,Ross借鑑了空間金字塔的思路,使用了一層空間金字塔。
Fast R-CNN
Ross Girshick
Microsoft Research
rbg@microsoft.com
摘要
本文提出了一個快速的基於區域推薦的卷積網絡方法(Fast R-CNN)用於對象檢測。Fast R-CNN在前人工做的基礎上使用深度卷積網絡,能夠更有效地分類物體推薦。相比以前的工做,Fast R-CNN進行了多項創新,在提升了檢測精度的同時,也提升了訓練和測試速度。Fast R-CNN訓練了一個超深VGG16網絡,訓練時間比R-CNN快9倍,測試時間快213倍,在PASCAL VOC2012上達到了更高的mAP。相比SPPnet,Fast R-CNN訓練快3倍,測試快10倍,而且更加準確。Fast R-CNN用Python和C++(使用Caffe)實現,以MIT協議開放在:https://github.com/rbgirshick/fast-rcnn