論文筆記-SNIPER:Efficient Multi-Scale Training

  1. 介紹 目前的目標檢測架構都是對輸入圖像的所有像素進行操作,從而產生proposals等,當採用多尺寸的圖像金字塔時,所需的存儲空間很大,在訓練時,單一GPU上能訓練的圖像數量很小(取決於GPU的顯存和圖像的分辨率),這樣就造成了batch size很小,從而使訓練時間很長。因此作者提出了一種新的訓練思路:先粗略定位一下正負例所在的區域,然後以該區域內的像素信息作爲卷積網絡的輸入,再精確檢
相關文章
相關標籤/搜索