格「物」致知:多模態預訓練再次入門

©PaperWeekly 原創 · 作者|Chunyuan Li 單位|Microsoft Research Researcher 研究方向|深度生成模型 本文簡要闡述了基於視覺和語言信息的多模態學習的緣由和發展現狀,並介紹一種多模態預訓練的方法 Oscar 來引導大家入門瞭解這個領域。爲什麼說是再次入門呢?因爲前段時間在已經涌現出不少多模態預訓練的方法,而我們展現一種另外一種打開多模態數據的方式
相關文章
相關標籤/搜索