編碼技術新突破:字節跳動 AVG 讓視頻縮小 13%

字節跳動的海外技術團隊在全球視頻編碼領域實現最新突破。算法

據聯合視頻專家組 JVET 官網顯示,字節跳動 AVG(先進視頻團隊)今年 2 月發起一項視頻壓縮的技術提案,該提案可以在優化壓縮質量的同時,節約至少 13% 的存儲和帶寬。例如,一段 180 分鐘 H.266/VVC 標準的高清視頻(1080P 分辨率),大約須要 3GB 的數據體積,應用新技術後只須要 2.6GB。這是業界公開的單個智能編碼工具的最佳性能增益。segmentfault

字節跳動 AVG 在美國加州創建研發團隊,成員有來自高通、微軟、英特爾等巨頭的資深研究員,也有出身海內外頂級院校的新生代。在此前 JVET 制定新一代國際視頻編解碼標準 H.266/VVC 的過程當中,字節跳動 AVG 累計提交 260+ 項技術提案,其中 130+ 項被採納,被採納提案數和採納率均排在世界前列,是 H.266/VVC 核心算法的主要貢獻者之一。網絡

視頻是由一張張圖片鏈接起來的動態圖像序列,視頻編解碼則是視頻應用的底層核心技術,做用是對圖像進行壓縮和數字編碼,以儘量小的帶寬傳送高質量的視頻數據。H.266/VVC 可以在不影響畫質的狀況下,把視頻碼率下降到前一代標準 H.265/HEVC 的一半。原本只夠放標清視頻的網速,也能流暢播放高清視頻。架構

這次字節跳動 AVG 提出的新算法,旨在經過深度學習技術構建減小視頻壓縮失真的濾波器(DAM),主幹是基於殘差單元堆疊的深度卷積網絡,輔以自適應模型選擇以最大程度適應特性複雜的天然視頻。所謂殘差單元是指經過引入跳層鏈接,容許網絡把注意力放在變化的殘差上,這與視頻圖像幀之間的殘差有殊途同歸之妙,好比武林高手決鬥,「劍光一閃」,每一幀圖像絕大部份內容是相同的,閃動的劍光造成殘差,這也是視頻編碼壓縮的重點關注對象。工具

實驗結果顯示,相比 H.266/VVC 最新標準,字節跳動的 DAM 解決方案可以爲視頻編碼性能帶來顯著提高,亮度信號 Y 可實現 10.28% 的性能增益,兩個色度信號 U 和 V,性能增益也分別達到 28.22% 和 27.97%,在視頻質量有所優化的同時,至少還可縮小 13% 的數據體積。性能

測試用例來自國際標準組織的測試視頻
圖:測試用例來自國際標準組織的測試視頻學習

據悉,字節跳動 AVG 已自主研發了 BVC2.0 編碼器,首次參加國際權威的 MSU 2020 視頻編碼器大賽,就在四項評價指標上包攬第一。AVG 的各項研究成果,也將經過 BVC 編碼器的升級換代投入應用,包括抖音、西瓜視頻、今日頭條等 App 的視頻類內容處理,以及雲計算、雲遊戲等基礎架構領域,從而爲用戶帶來更高清畫質、更流暢播放的視頻體驗。測試

AVG 除了深度參與國際視頻標準制定外,也爲國產新一代視頻壓縮標準 AVS3 作出重要貢獻,包括塊劃分、運動矢量編碼及預測、色-亮度幀內預測等多項原創性技術被 AVS3 視頻標準所採納。字節跳動所以得到 2019 年度 AVS 產業技術創新之提案獎,是迄今惟一獲獎的互聯網企業。優化

字節跳動 AVG 的張莉博士介紹說,視頻壓縮標準做爲服務商必須遵循的規範,不只蘊含着難以估量的商業價值,也會爲用戶帶來實實在在的便利。經過標準制定與產品研發,字節跳動會持續創新並輸出技術能力,與行業一塊兒爲用戶提供更優質的視頻服務。編碼

segmentfault 思否

相關文章
相關標籤/搜索