《Show and Tell: A Neural Image Caption Generator》閱讀筆記及相關知識

Image Caption 指的是自動從一張圖片生成描述性語句,不僅能指出圖片中包含的物體,而且能夠表達圖片中物體的相互關係、他們的屬性以及他們共同參與的活動。 這有點類似於「看圖說話」,但是對於機器來說卻是一項很有挑戰性的任務。因爲機器不僅要能檢查出圖像中的物體,而且要理解物體之間的相互關係,最後還要用合理的語言表達出來。 Encoder - Decoder 在Image Caption中,使用
相關文章
相關標籤/搜索