多模態在內容理解的應用

時間 2021-01-10

標籤機器學習多模態简体版

原文原文鏈接

2020 年機器學習趨勢：建立統一的跨媒體多模態內容理解內核描述類任務（表示，轉換，對齊，融合）視頻描述 1 Predicting Visual Features from Text for Image and Video Caption Retrieval：輸入原始圖像，圖像標題和衆多描述圖像的句子，將它們映射到隱空間併合成視頻描述。 2 Watch, Listen, and Describ

>>阅读原文<<