BERT跨模態之後:佔領了視覺常識推理任務榜單TOP 2!

星標/置頂小屋,帶你解鎖 最萌最前沿的NLP、搜索與推薦技術 文 | 小鹿鹿lulu 編 | YY 前言 由於 BERT-like 模型在 NLP 領域上的成功,研究者們開始嘗試將其應用到更爲複雜的 多模態 任務上。要求模型除文本數據以外,還要接收其他模態的數據(比如圖像、聲音等),在理解和關聯多模態數據的基礎上,完成更加複雜也更貼近實際的跨模態任務。 而 視覺常識推理 (Visual Commo
相關文章
相關標籤/搜索