CVPR 2020 | ActBERT: 自監督多模態視頻文字學習

時間 2021-07-13

原文原文鏈接

©PaperWeekly · 作者｜朱霖潮單位｜悉尼科技大學研究方向｜視頻理解自監督特徵學習近年來已有如火如荼的發展，並從單模態的自監督學習，如圖片自監督特徵學習，視頻自監督特徵學習，蔓延到多模態，利用圖片與文字或者視頻與文字的關聯性進行特徵學習。利用圖片與文字關聯性進行自監督學習已有非常多優秀的工作，如 Vilbert, LXMERT, VisualBERT, VLBERT, UNIT

>>阅读原文<<