Self-critical Sequence Training for Image Captioning

時間 2020-12-30

原文原文鏈接

Self-critical Sequence Training for Image Captioning 原文地址時間：2017 Intro 近年來策略梯度（policy-gradient）在訓練深度端到端系統上展現了它的能力，它可以以不可導的度量作爲目標函數，本文考慮的問題就是使用強化學習來訓練image captioning模型，稱爲self-critical sequence traini

>>阅读原文<<