連接圖像和自然語言(翻譯)一

摘要 人工智能領域的一個長期目標是開發可以感知和理解我們周圍豐富的視覺世界的代理,並且可以用自然語言與我們溝通。由於計算基礎設施,數據收集和算法的同步發展,在過去幾年裏,這個目標已經取得重大進展。視覺識別方面的進步尤爲迅速,現在的計算機可以將圖像分類爲與人類相媲美的類別,甚至在某些情況下,例如對犬類進行分類,可以超越人類。然而,儘管取得了令人鼓舞的進展,但是視覺識別的大部分進展仍然是在爲圖像分配一
相關文章
相關標籤/搜索