讀書筆記--《Show and Tell: A Neural Image Caption Generator》

時間 2020-12-23

原文原文鏈接

這篇文章設計了一個端到端的網絡來解決image caption問題，這個模型將最先進的視覺和語言模型結合在了一起，從而在效果上取得了巨大的進展。這篇文章提出了一個神經和概率框架來對圖像生成描述，模型利用循環神經網絡將可變長度的輸入編碼變成固定長度的編碼並且用這種方式將其解碼成期望輸出的句子。通過最小化這個函數來獲得圖片的正確描述這個網絡選用了L

>>阅读原文<<