Self-critical Sequence Training for Image Captioning

Self-critical Sequence Training for Image Captioning 原文地址 時間:2017 Intro 近年來策略梯度(policy-gradient)在訓練深度端到端系統上展現了它的能力,它可以以不可導的度量作爲目標函數,本文考慮的問題就是使用強化學習來訓練image captioning模型,稱爲self-critical sequence traini
相關文章
相關標籤/搜索