論文筆記:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning

論文鏈接:Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning Introduction 目前大多數的基於attention機制的image captioning模型採用的都是encoder-decoder的框架。然而在decode的時候,decoder應該對不同的詞有不同的atten
相關文章
相關標籤/搜索