Visual Genome 數據集標註內容

2、Visual Genome 的數據表現 Visual Genome 數據集包括 7 個主要部分:區域描述、對象、屬性、關係、區域圖、場景圖和問答對。圖 4 展示了一幅畫的每一個部分的例子。要對圖像進行理解的研究,我們從收集描述和問答對開始。這些是原始的文本,沒有任何長度和詞彙的限制。下一步,我們從描述中提取對象、屬性和關係。這些對象、屬性和關係一起構造了我們的場景圖,這代表了一般的圖像。在這個
相關文章
相關標籤/搜索