【論文翻譯】PERFECT MATCH: IMPROVED CROSS-MODAL EMBEDDINGS FOR AUDIO-VISUAL SYNCHRONISATION

PERFECT MATCH: IMPROVED CROSS-MODAL EMBEDDINGS FOR AUDIO-VISUAL SYNCHRONISATION 超匹配:改進了用於音頻-視頻合成的跨地帶調製   摘要: 本文提出了一種學習音頻到視頻同步的強大跨模態嵌入的新策略。在這裏,我們將問題設置爲跨模態檢索,其中目標是找到給定短視頻剪輯的最相關的音頻片段。該方法建立在跨模態自我監督學習表示的最新
相關文章
相關標籤/搜索