Neural Baby Talk

寫下自己的理解。 1 Visual word,上圖中的dog,cake就是visual word,也就是detector檢測到的物體的詞彙。   Text Word,「is on with」就是text word,也就是與視覺沒有關係的詞彙,「自己生成的嗎?」 2 主要貢獻——提出一個框架,能夠生成(基於檢測到的實體的)自然語言。 方法=slot+神經描述方法 3 我們的方法能夠產生一些train
相關文章
相關標籤/搜索