論文閱讀：Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval

時間 2021-01-11

原文原文鏈接

多義詞的視覺語義的嵌入式交叉檢索，來自 CVPR 2019 項目地址摘要視覺嵌入的目標是找到一個共享的空間，在這個空間中相關的視覺和文本彼此之間比較接近。當前大多數方法都學習將實例映射到共享空間中單個點的內嵌式嵌入函數（映射是一對一的）。不幸的是，內射式嵌入不能有效地處理具有多種可能含義的多義詞實例。最好情況下，它只能找到不同含義的平均的表達。這阻止了它在真實場景中的使用，它們的跨模態的聯繫也