視頻加強和超分是計算機視覺領域的核心算法之一,目的是恢復降質視頻自己的內容,提升視頻的清晰度。該技術在工業界有着重要的實用意義,並對於早期膠片視頻的質量和清晰度的提高有着重大的意義。算法
根據數據類型分類,目前的超分辨工做分爲圖像超分和視頻超分。網絡
圖像超分性能
圖像超分領域隨着卷積神經網絡的應用,不斷有新的網絡結構取得更優的性能,如下 6 種結構是目前圖像超分領域所使用的方法:學習
殘差結構 目前超分領域廣泛認爲更深的網絡可以帶來更優性能,但更深的網絡也帶來訓練困難的問題,殘差結構可以緩解該問題,例如:EDSR;設計
多分支結構 從增長網絡的寬度來提高性能,也是一種加強特徵表達的方式,例如:REDNet;視頻
(以上兩種結構都會帶來巨大的參數量)遞歸
循環結構 利用共享網絡參數、循環遞歸的方式,在減小網絡參數的狀況下提高性能,例如:DRCN;圖片
漸進式結構 把超分辯設計成多個階段的網絡結構,利用逐步增長分辨率的方式,提升超分性能,例如:SCN;get
注意力機制 提升特徵的表達能力,從而提升性能,例如:RCAN、DRLN;class
對抗模型 利用 GAN 的思想生成更符合人眼視覺評價的高分辨率圖片,例如:SRGAN、EnhanceNet、ESRGAN.
視頻超分
視頻超分與圖像超分的區別主要有兩點,包括:
視頻幀對齊 由於視頻中存在各類運動信息,因此存在參考幀和目標幀的誤差,但超分辯通常須要利用鄰幀跟參考幀作對齊;
視頻幀融合 視頻中存在運動模糊和場景切換的問題,如何有效融合視頻幀,去除干擾信息,對最終的結果也有影響。
而在這兩方面,視頻超分的主要結構有如下幾個類型:
三維卷積 直接利用 3D 卷積捕捉時域特徵的功能,直接作幀間融合;
循環結構 可用於提取幀間關係,融合目標幀和參考幀的信息,例如: LSTM 的結構來作幀間融合;
濾波器預測 利用融合後的幀間信息預測濾波器參數,再經過濾波的方式作超分辯,得到自適應的濾波效果;
推薦閱讀: