論文筆記（四）：Temporal Action Localization by Structured Maximal Sums

時間 2021-01-13

原文原文鏈接

一、摘要我們解決視頻中時間動作定位問題。將動作定位作爲對任意長度時間窗口的結構化預測，其中每個窗口被評分爲逐幀分類分數的總和。此外，我們的模型將每個動作的開始，中間和結束分類爲單獨的組件，允許我們的系統明確地模擬每個動作的時間演變，並利用此結構中存在的信息時間依賴關係。在這個框架中，我們通過搜索結構化最大和來定位動作，這是一個我們開發一種新穎，效率很高的算法解決方案的問題。使用來自深度