論文筆記(四):Temporal Action Localization by Structured Maximal Sums

 一、摘要 我們解決視頻中時間動作定位問題。 將動作定位作爲對任意長度時間窗口的結構化預測,其中每個窗口被評分爲逐幀分類分數的總和。 此外,我們的模型將每個動作的開始,中間和結束分類爲單獨的組件,允許我們的系統明確地模擬每個動作的時間演變,並利用此結構中存在的信息時間依賴關係。 在這個框架中,我們通過搜索結構化最大和來定位動作,這是一個我們開發一種新穎,效率很高的算法解決方案的問題。 使用來自深度
相關文章
相關標籤/搜索