Visual Genome 數據集標註內容

二、Visual Genome 的數據表現web Visual Genome 數據集包括 7 個主要部分:區域描述、對象、屬性、關係、區域圖、場景圖和問答對。圖 4 展現了一幅畫的每個部分的例子。要對圖像進行理解的研究,咱們從收集描述和問答對開始。這些是原始的文本,沒有任何長度和詞彙的限制。下一步,咱們從描述中提取對象、屬性和關係。這些對象、屬性和關係一塊兒構造了咱們的場景圖,這表明了通常的圖像。
相關文章
相關標籤/搜索