圖像標註：圖像文本語義對齊

時間 2021-01-16

原文原文鏈接

1）沒有標籤的圖像語義如何提取 2）端到端的對齊過程如何構建，具體損失函數是什麼 3）attention如何加入，雙端反饋如何建立聯繫，attention訓練過程的損失函數是什麼 1: Karpathy A, Fei-Fei L. Deep Visual-Semantic Alignments for Generating Image Descriptions. IEEE Trans Patter

>>阅读原文<<