論文筆記 A Neural Multi-sequence Alignment TeCHnique (NeuMATCH) (CVPR2018)

這篇文章做的任務是異構序列數據的對齊,針對以視頻文本爲例,提出了用LSTM堆棧結構來處理多種對齊任務(one-to-one, one-to-many, skipping unmatched elements,non-monotonic alignment等)。 示例 這項任務的基本定義就是,輸入連續的視頻幀 V={vi}i=1,2,...N V = { v i } i = 1 , 2 , . .
相關文章
相關標籤/搜索