Show and Tell: A Neural Image Caption Generator 翻譯

時間 2020-12-23

原文原文鏈接

摘要自動描述圖像的內容是連接計算機視覺和自然語言處理的人工智能中的一個基本問題。在本文中，我們提出了一個基於深度重構架構的生成模型，它結合了計算機視覺和機器翻譯方面的最新進展，可以用來生成描述圖像的自然語句。訓練該模型以最大化訓練圖像給出的目標描述句子的可能性。在幾個數據集上的實驗顯示模型的準確性和它從圖像描述中學到的語言的流暢性。我們的模型通常是相當準確的，我們從定性和定量兩方面進行驗證。例如