網絡運行時間提高100倍,Google使用的AI視頻理解架構有多強?

譯者 | 劉暢 出品 | AI科技大本營(ID:rgznai100) 視頻理解是一個很有挑戰性的問題。 由於視頻包含時空數據,因此圖像的特徵表示需要同時提取圖像和運動信息。 這不僅對自動理解視頻語義內容有重要性,還對機器人的感知和學習也至關重要,比如網絡視頻分類或體育活動識別。 就和人類一樣,機器人相機的輸入很少是靜態的快照,而是以連續視頻的形式出現。 當今深層學習模型的能力在很大程度上依賴於其神
相關文章
相關標籤/搜索