VC R-CNN | 無監督的視覺常識特徵學習(附源碼)

計算機視覺研究院專欄 作者:Edison_G 最近CVPR不是在線直播,我關注了下,發現一篇很有意思的paper。讓我想到在研究生有做過類似的算法——因果關係。今天我們看看這位作者是怎麼處理的。 作者提出了一種新的無監督特徵表示學習方法,即Visual Commonsense R-CNN(VC R-CNN),作爲一種改進的視覺區域編碼器,用於Captioning和VQA等高級任務。給定圖像中檢測到
相關文章
相關標籤/搜索