深度學習中的分類與迴歸任務

分類:輸入一張貓的圖片,最終要輸出這張圖片就是貓的概率; 定位:輸入貓的圖片,輸出一個box,框出貓,得到這個box矩形的初始位置,用x,y表示,再得到矩形的寬和高; 分類+定位:不光要定位出貓的位置,還要確定這張圖片就是貓。 首先,輸入一張圖片,經過一個CNN,提取出一個高維的特徵,最後面一層不再接softmax進行分類,而是預測出4個座標值,由[x,y,w,h]組成,那麼如何來計算這四個值呢?
相關文章
相關標籤/搜索