阿里雲黃海宇:窄帶高清2.0——讓直播更驚豔的魔術

摘要: 2018年4月11-12日,2018亞太CDN峯會在北京隆重召開,大會由亞太CDN領袖論壇、電視雲論壇、短視頻論壇、視頻雲論壇、新技術論壇、運營商論壇、國際雲論壇等7大部分組成。在視頻雲論壇上,阿里雲視頻雲高級算法專家黃海宇做了題爲《窄帶高清2.0——讓直播更驚豔的魔術》的主題致辭。算法

 

2018年4月11-12日,2018亞太CDN峯會在北京隆重召開,大會由亞太CDN領袖論壇、電視雲論壇、短視頻論壇、視頻雲論壇、新技術論壇、運營商論壇、國際雲論壇等7大部分組成。在視頻雲論壇上,阿里雲視頻雲高級算法專家黃海宇做了題爲《窄帶高清2.0——讓直播更驚豔的魔術》的主題致辭。下面爲演講內容:網絡

 

我是來自阿里雲視頻雲的黃海宇,我目前從事的工做主要是阿里雲視頻直播相關技術。隨着直播的發展,CDN的帶寬、CDN的成本以及視頻的清晰度已經成爲一個很是重要的問題,個人演講題目是「窄帶高清2.0——讓直播更驚豔的魔術」。網站

 

其實,阿里雲早在2015年就已經提出了窄帶高清的概念。這個概念提出來之後,不少友商開始引用這個概念,而且也推出了相似服務。阿里雲

 

那麼,咱們當初提出窄帶高清的緣由是什麼?在近兩年來,在此基礎上又作了哪些發展呢?今天我將給你們分享一下。編碼

 

你們觀看視頻時,都但願畫質清晰,但實際上,在看互聯網直播是,咱們更多看到的是比較模糊的視頻。那麼,咱們是否如今沒有辦法制做高清視頻呢?答案是否認的。雲計算

 

上個月,阿里雲在深圳雲棲大會現場第一次進行了8k直播,舞臺的屏幕上顯示了從1300千米之外的阿里巴巴杭州園區傳輸回來的直播圖像視頻,現場觀衆清晰地看到了景泰藍淘公仔的精緻畫面。但實際的直播業務場景中,用戶在作互聯網直播的時候,因爲網絡傳輸緣由,並不能讓每位觀衆都能看到很是清晰的視頻,高清晰度的直播的限制主要在網絡的帶寬上。視頻

 

 

構建在阿里雲上的一個直播平臺調研數據顯示,只有16%的用戶可以看到超清的視頻,54%的用戶可以看到高清的視頻,30%的用戶看不到高清視頻。blog

 

若是,能把超清碼率往高清靠一下的話,是否是更多人就可以看到超清的視頻了呢?遊戲

 

實際上,咱們也正在向這個方向努力,但這樣會帶來一個問題,把超清碼率往高清靠的時候,對清晰度會有多大影響呢?作視頻編解碼朋友都會熟悉PSNR的公式,被普遍應用在衡量各類不一樣編碼器的編碼質量上,實際上這個公式確實很是客觀地描述了一個視頻通過視頻編碼之後信息量的損耗,站在信息論的角度來進行分析的。但實際視頻是人眼來看的,人眼對視頻的敏感度和視頻在編碼過程當中損失的信息量並非直接對應的。開發

 

窄帶高清——人眼主觀感覺最優爲基準的視頻編碼技術

 

基於以上討論,能夠引出窄帶高清的概念。窄帶高清其實是一套以人眼的主觀感覺最優爲基準的視頻編碼技術,研究的是在帶寬受限狀況下,如何追求最佳的視覺感覺。

 

把範圍縮小到人眼主觀感覺,以及帶寬受限兩個條件時,會發現不少有意思的事情。

 

首先和如今的編碼標準發展趨勢是相同的,效果可以疊加。編碼器發展時間,差很少每十年,編碼器都會發展一代,編碼質量會大約節約30%-50%的碼率,這個碼率的節約是按照PSNR評價標準來作的。但利用窄帶高清的技術,把焦點集中在人眼的感覺,能夠把業界廣泛浪費的帶寬節省下來,讓咱們的帶寬更多放在人眼感興趣的地方,能夠輕鬆達到30%的帶寬節約,幾乎能夠平等地媲美一代編碼器的進步。由於技術關注點在人眼上,咱們能夠把業界廣泛處理很差的複雜場景作得漂亮,非專業觀衆一眼就能夠看出優點。

 

窄帶高清1.0——兩套人眼視覺模型

 

窄帶高清1.0是阿里巴巴在2016年推出的一個版本。在窄帶高清1.0的背後隱藏着兩我的眼視覺模型:

第一個模型稱之爲保真度與主觀評分值之間的世界模型,橫座標是視頻保真度,表明編碼出來的製品與原始視頻之間信息量差異,縱座標是人眼對視頻的評分,總共是5分。隨着編碼後視頻愈來愈接近原始視頻,人眼對視頻的要求是愈來愈高的,但並非一條線性的形狀,是分紅三段曲線,這使得阿里雲知道中間這段很是陡峭的區域正是設置比較好碼率的地方,在兩端比較平坦的地方,加大視頻碼率,提升視頻客觀清晰度,實際上並不能帶給人眼很好的清晰度。中間稍微把碼率提升一點,視頻對人眼的感覺就徹底不同,每一比特碼率都會很是有所值。因此阿里雲在設置視頻碼率時會盡量選擇視頻檔位在中間的區域。

 

第二個模型是分辨率與碼率的模型。在這個模型中,關注的是一樣的碼率到底應該設置多少清晰度,或對一個給定的清晰度,應該設定一個怎樣的碼率。傳統視頻網站中,一般設置方法,好比480p會設600k,720p設1.2m,超清1080p設2.5m,相似這樣一個比較固定的碼率設置。實際上每一個視頻所須要的碼率不同,表達的清晰度也不同。例如,對於一個運動場景不復雜的教育視頻來講, 1080p在的碼率也會有很是好的效果。在實踐中,咱們會根據視頻的類型和清晰度,預期選擇碼率和分辨率,同時根據視頻內容作合理的碼率分配。

 

經過傳統方法,一般會設一個720p分辨率,碼率大概是1m。實際上這個視頻表現很是糟糕,鳥叔襯衫上全是馬賽克,並且雪花點所有變得模糊。緣由是這個視頻運動很是複雜,只有1m碼率,這種狀況下,須要用1m碼率去表達1280×720象素,對每個象素的表現都會很是差,會損失不少象素細節,致使總體效果。

 

咱們作過之後的效果,只用了887k碼率,比以前碼率節省15%-20%,用的是432p的分辨率,在窄帶高清時常常會設置這樣的分辨率,追求達到最好的人眼主觀感覺的效果。

 

窄帶高清2.0——深刻微觀世界 分析視頻細節

 

窄帶高清2.0是阿里雲在2017年杭州雲棲大會發布的。窄帶高清2.0深刻到微觀層面,分析視頻每個細節,發現這些視頻細節對人眼敏感度是怎麼樣的。引入人眼敏感度模型概念,關注人眼到底會關注哪些細節、忽視哪些細節。對人眼關注的地方會給予更高的碼率,甚至會對原始視頻進行一些修復,使其更適合人眼觀看的體驗。對於忽視的地方能夠下降一些碼率。

 

從咱們主觀評測能夠發現,基於H.264的窄帶高清2.0已經徹底超越了x264 veryslow的效果,與x265的veryslow效果至關,經過窄帶高清2.0,使得咱們能夠超越當前編碼器,提早進入到下一代編碼器。

 

 

下面咱們看下窄帶高清2.0的實戰。下圖的直播畫面中,在聚焦區域,主播的臉、頭髮,窄帶高清2.0的效果會顯得更加柔順。在一些脫焦的區域,窄帶高清2.0分配了比較少的碼率,徹底不會影響人眼對它的主觀感受。

 

另外一個實戰場景是遊戲直播。槍戰類型的遊戲直播很是消耗碼率,1080p設置2.9m的遊戲直播,總體來看會有很是多的馬賽克,由於這個視頻在2.9m,徹底沒法表達1080p的象素,窄帶高清2.0使用了720p的分辨率,一樣2.9m,效果會好得多,另外,窄帶高清2.0將人眼比較敏感的文字,紋理作了加強,整個視頻看起來更加舒服。

 

窄帶高清2.0能夠節約大量的帶寬成本,同時也可以提升視頻觀看流暢度,在高碼率時能節省差很少1倍的碼率,在低碼率時能節省20%-30%,綜合能夠獲得30%以上成本的節約。另外,窄帶高清2.0還能夠提升清晰度,若是追求的是視頻清晰度,能夠設置相同的碼率。

 

在一般狀況下,視頻畫質越好帶寬費用確定越高,帶寬又是視頻服務中佔比很高的一項成本,不少開發者都在尋求效果與成本的平衡點。阿里雲的窄帶高清技術,就能夠完美的解決這一難題,這就是雲計算技術帶來的實際價值體現。

 

原文連接

閱讀更多幹貨好文,請關注掃描如下二維碼:

相關文章
相關標籤/搜索