視覺與語言領域年度進展概述

Image/Video Captioning 1. 起源 計算機視覺已經發展了五十多年。在此期間,視覺理解(visual understanding)這一領域取得了長足的進展。爲了讓機器像人類一樣能夠「看」懂周圍的世界,計算機視覺研究人員設計了大量的人工特徵去描述一件物體,並且提出了各種模型去識別這些人爲設計的特徵。幾年前,當我們談論圖像或視頻理解時,我們能做的只是給一幅圖像或一段視頻自動打上一些
相關文章
相關標籤/搜索