Neural Baby Talk學習筆記

Neural Baby Talk學習筆記 [1803.09845] Neural Baby Talk 1、介紹 深度學習時代 採用LSTM模型,過分依賴language model,導致caption經常與圖像內容關聯不夠。 深度學習之前 更依賴圖像內容,而對language model關注不多,例如採用一系列視覺檢測器檢測圖像內容,然後基於模板或者其他方式生成caption 作者觀點 減少對語言
相關文章
相關標籤/搜索