目標檢測入門系列手冊二:RCNN訓練教程

目標檢測需要獲取圖片中所有目標的位置及其類別,對於圖2-1 中的 3 張圖而言,當圖片中只有一個目標時,「regression head」預測 4 個值,當圖片中有 3 個目標時,「regression head」預測 12 個值,那麼當圖片中有多個目標時,「regression head」要預測多少個值呢? 這時根據讀者已經學過的一些知識,可能會嘗試用滑窗的方法來解決,如圖2-2所示。但是,這裏
相關文章
相關標籤/搜索