視頻理解新方向:時域語言定位 綜述

點擊我愛計算機視覺標星,更快獲取CVML新技術 本文原載於知乎,作者吳捷,目前於中山大學就讀研究生。研究領域爲計算機視覺與自然語言處理。 作者不僅綜述了時域語言定位(Temporally Language Grounding)相關技術,還開源了多個state-of-the-art的實現,總結了一份資源列表,可謂相關研究者的端午佳節大福利~ 開源網址在文末,歡迎去GitHub給大佬加星。 一. 任務
相關文章
相關標籤/搜索