無參考評估在雲信的視頻測試實踐

導讀:在實時音視頻領域,如何實現視頻的全自動化評估是一個業界共同的難題。無參考(NR)技術不須要關於參考視頻的任何信息,無疑是視頻全自動化評估的曙光。本篇文章將介紹雲信測試組最近在使用的一種視頻無參考評估方法,及其自動化應用方案。html

文|網易雲信資深測試工程師前端

背景介紹 linux

視頻質量評估的目的是準確衡量出人眼對於視頻內容的感知。算法

源視頻在通過採集編碼傳輸解碼等模塊傳輸到人眼以後,會不可避免的引入一些壓縮失真,嚴重的時候甚至會有綠屏、花瓶、馬賽克等問題。數據庫

在業界評估視頻質量有兩種經常使用方法:視頻質量主觀評估和視頻質量客觀評估windows

常見的主觀實驗流程通常以下:服務器

1. 選取有表明性的源視頻架構

2. 添加待衡量的視頻處理方案框架

3. 按照ITU標準設計主觀實驗ide

4. 招募志願者觀看視頻並打分

5. 收集主觀打分並剔除無效數據

6. 數據建模並得出實驗結論。

視頻質量客觀評估經過一些評估標準來量化視頻質量,主要分爲三種,全參考(FR)、部分參考(RR)、無參考(NR)

全參考評估比較處理先後的兩段視頻每一個像素的差異。部分參考評估提取兩段視頻的一些特性,並依此給予它們評分。

全參考評估和部分參考評估均爲有參評估,常見的評估算法有PSNR, SSIM VIF VMAF PEVQ等,須要輸入視頻和輸出視頻才能得出評估結果,適用於離線測試。

無參考評估是在沒有任何原視頻的參考下進行評估,比較適合線上視頻評估、視頻加強和視頻合併等場景。

顯然主觀評估是一個週期長,費時費力的過程。經過主觀打分來驗證全部視頻質量是不可行的。

客觀評估經過一些與主觀質量評估結果相近的數學模型來量化人眼對於視頻內容的感知,能夠提高一些評估的效率。

在網易雲信的視頻類效果評估測試中,包括對編碼器優化(H26四、X264效果優化)、編碼器升級(H264升級到H265,H264升級到VP8)、Qos優化等的測試以主觀評估爲主,客觀評估爲輔

在客觀評估的方式中,全參考的評估方式好比PSNR、SSIM、VMA等主要用於編碼器的優化和升級測試中。固然除了全參考的評估方式,網易雲信測試團隊也在嘗試應用無參考評估到音視頻相關的測試中。

下面將介紹網易雲信最近在使用的一種視頻無參考評估方法。

Video Quality Indicators簡單介紹

Video Quality Indicators 是一款開源的音視頻無參考評估方案,提供了視頻的卡頓、噪聲、橫紋、畫面缺失、曝光度等無參考分析。

在intel開源的QosTestFramework中使用了Video Quality Indicators爲其無參考評估的一個方法。

Video Quality Indicators(http://vq.kt.agh.edu.pl//metr...),支持windows、mac、linux。經過分析yuv文件,來評估視頻文件質量。

官網提供了多種調用方案,Bash、Python、Matlab等。支持對卡頓、畫面缺失、塊效應、橫紋、躁點、畫面閃爍等進行分析。 

主要支持分析的字段信息以下:

其餘字段展現詳見:http://vq.kt.agh.edu.pl//metr...

下面經過一段視頻來展現下 Video Quality Indicators 的分析效果(截取自官網):
點擊觀看視頻

QosService框架設計

Video Quality Indicators提供15種視頻相關指標的分析結果,並且Video Quality Indicators分析的是圖像,即給出的是幀與幀之間的對比結果,因此一段5分鐘的視頻,在平均幀率25幀的狀況下,Video Quality Indicators會提供7500個數據點。

原數據類型多且數據量大,爲了方便分析,下降工具使用門檻,提高工具利用率,對Video Quality Indicators提供的無參考分析功能進行了服務化。

在服務化過程當中,使用了tornado爲服務框架,在QosTestFramework的基礎上,將分析結果持久化到數據庫中,最後使用前端進行分析結果的展現。

總體實現架構以下所示:

用戶經過輸入UID、CID來觸發視頻文件的分析和分析結果顯示。

  • DL VIDEO:與錄製服務器交互下載錄製文件到本地
  • Ffmpeg:轉碼對應的文件到yuv格式(Video Quality Indicators僅支持分析yuv格式)
  • VQ:Video Quality Indicators對對應的yuv文件進行分析而且將數據持久化到數據庫中

前端最終呈現:

無參考分析實例:

點擊觀看視頻

能夠看到視頻運動的小牛附近畫面模糊而且存在部分噪點,使用QosService分析的結果以下:

Blur表示了畫面的清晰度,blur數值大於5,說明畫面比較模糊,數值越大表明畫面越模糊。如圖軟件的分析結果表示清晰度異常,與實際狀況相符。

Noise表示畫面中存在的噪點,數值越大,代表噪點越多,畫面質量越差。Noise大於30,即認爲畫面的噪點過大。如圖軟件的分析結果表示噪點異常,與實際狀況相符。

Blockloss:表示畫面中存在的畫面缺失,這個視頻畫面完整度較好,測算出的值與實際狀況保持一致。

Contrast:表示畫面的對比度,這個視頻中圖像的對比度在肉眼可接受的範圍內,測算出的值與實際狀況保持一致。

Freezing:表示畫面的卡頓狀況,這個視頻中未出現卡頓,測算出的值與實際狀況保持一致。

總結和展望

在實時音視頻領域,如何實現視頻的全自動化評估是一個業界共同的難題。無參考(NR)技術不須要關於參考視頻的任何信息,無疑是視頻全自動化評估的曙光。引用下魯迅先生的名言:其實地上本沒有路,走的人多了,也便成了路。

致敬下爲視頻全自動化評估作出努力的業界同胞們。

*各渠道文章轉載需註明來源及做者

相關文章
相關標籤/搜索