CVPR 2020 | ActBERT: 自監督多模態視頻文字學習

©PaperWeekly · 作者|朱霖潮 單位|悉尼科技大學 研究方向|視頻理解 自監督特徵學習近年來已有如火如荼的發展,並從單模態的自監督學習,如圖片自監督特徵學習,視頻自監督特徵學習,蔓延到多模態,利用圖片與文字或者視頻與文字的關聯性進行特徵學習。  利用圖片與文字關聯性進行自監督學習已有非常多優秀的工作,如 Vilbert, LXMERT, VisualBERT, VLBERT, UNIT
相關文章
相關標籤/搜索