圖像標註:圖像文本語義對齊

1)沒有標籤的圖像語義如何提取 2)端到端的對齊過程如何構建,具體損失函數是什麼 3)attention如何加入,雙端反饋如何建立聯繫,attention訓練過程的損失函數是什麼 1: Karpathy A, Fei-Fei L. Deep Visual-Semantic Alignments for Generating Image Descriptions. IEEE Trans Patter
相關文章
相關標籤/搜索