計算機也可以看「視頻」,理解「視頻」

聯合編譯: 高斐  章敏 摘要 我們將在文中介紹一種用於視頻中動作檢測的端對端方法,該方法用於學習直接預測動作的瞬時改變。我們認爲,動作檢測是一個對運動目標進行觀察並細化假設的過程:觀察視頻中每一個動作變化瞬間,細化關於一個動作將何時發生的所有假設。基於該觀點,我們將提出的模型視爲一個基於遞歸神經網絡結構的代理人程序,該代理人程序與視頻進行交流互動。代理人程序觀察視頻幀序列,決定下一步觀察哪裏,何
相關文章
相關標籤/搜索