阿里雲李松林:全球實時傳輸網絡GRTN在互動直播中技術實踐

2021年6月9日,亞太內容分發大會暨CDN峯會在北京舉行,阿里雲智能邊緣雲技術專家李松林受邀參加互動直播論壇,分享基於阿里雲邊緣雲節點打造的全球實時傳輸網絡GRTN的設計思路、技術原理、特質與應用實踐,以及面向直播應用客戶提供穩定可靠的業務體驗。git

圖片算法

當前,主流的直播技術應用架構主要有兩種:直推和回源拉流 ,產生這兩種架構的緣由也比較簡單:一是業務場景須要連麥,須要低延遲雲合流;二是基於UDP的私有協議推流。爲保障主播在弱網狀況下能有較好的推流效果,而最重要的緣由是目前主流雲廠商尚未通用成熟的低延遲互動場景大規模應用的服務,這就致使了他們須要自建源站。只使用雲廠商通用的分發能力。支持 HTTPFLV 、RTMP 、HLS 大規模分發。編程

視頻直播服務自建面臨的挑戰
圖片安全

隨着直播場景和內容愈來愈豐富和專業,互動的需求也愈來愈多,交互的延遲要求也愈來愈高。原有的這套架構就很難知足需求了。因爲沒法知足本身的業務需求,許多企業客戶紛紛開始嘗試自建源站,作協議優化, 可是因爲直播技術門檻相對較高,不只須要投入資源,還須要專業的研發能力,同時後續還要長期持續運維和管理。網絡

阿里雲GRTN的定位
圖片架構

爲了可以下降直播的端到端延時,阿里雲從直播、短延時直播、RTC等應用場景出發,構建了GRTN(Global Realtime Transport Network)全球實時傳輸網。李松林介紹,阿里雲GRTN的定位是基於公共雲中心Region和邊緣雲節點,構建超低延時、全分佈式下沉的通訊級流媒體傳輸網絡。GRTN目前融合了互聯網直播和RTC等多種業務場景的音視頻流傳輸和交換。基於GRTN的短延時直播RTS能夠支持標準H5 WebRTC推播,在千萬級併發狀況下延時能夠控制在1s之內;RTC端到端延時能夠控制在250ms左右。GRTN可提供三大原子能力:流的發佈、訂閱、切換,用戶能夠基於這些能力構建通話場景、直播場景、連麥場景等等。併發

阿里雲GRTN的架構
圖片運維

阿里雲GRTN 的總體架構是由原來的直播體系進化而來。該架構具備控制和數據分離、混合組網、多路徑傳輸、自學習Qos等技術特色,對外能夠支持多種接入協議(rtc /rtmp / hls/ httpflv/ srt/ quic)。GRTN帶來的核心價值有:
降成本,GRTN是一個多業務融合的網絡,能夠支持直播、RTC和視頻上雲等多種場景,業務複用率高,另外GRTN內部鏈路更短,節點內的成本也更低。分佈式

提質量,GRTN內部組網支持採用動態選路的方式來構建的網狀結構,內部鏈路延時能夠作到20ms左右,而且內部鏈路採用了私有協議來進行高效傳輸。另外客戶端的推流和分發都是基於WebRTC來構建的,QoS擁塞控制是專門針對流媒體特性來進行設計的,而且還在基於線上數據建設進行持續迭代和打磨。高併發

易擴展,GRTN支持了WebRTC協議,能夠在單個鏈接通道上進行全雙工的通訊,從而能夠很自由的進行發佈和訂閱媒體流,在業務的擴展性上帶來了更大的想象空間。

GRTN關鍵技術-分佈式異構部署
圖片

在談到GRTN部署時,李松林指出,GRTN 的數據面能夠在不一樣的資源上部署,實現一份代碼,多種資源部署, 知足了低延遲全球覆蓋的需求。不只擁有了CDN原有的節點覆蓋資源 ,並且還支持中心Region和 MEC 等資源,讓業務體驗更優。

GRTN 的關鍵技術-對等組網和動態路徑規劃
圖片

針對豐富的資源實現高效利用是核心。傳統的路徑規劃主要關注質量 ,對節點的屬性和水位等狀況考慮較少,同時因爲流媒體的複用性,當一個流已經出如今某一個節點的時候,整個路徑選擇就面臨新的調整。目前的策略是經過探測選路尋找優質的節點和路徑集合。創建節點路徑狀態表。對每條路徑的不一樣維度進行量化打分。綜合權重和策略獲得一個新的最優解。
GRTN採用了混合組網方式,即層級結構和對等圖形方式相結合的組網的方式。選路中心會週期性收集內部鏈路探測的結果,爲了配合動態組網,流媒體大腦模塊須要對流信息進行管理,同時還須要支持路徑切換、容量規劃以及在成本和質量之間作綜合的調度。

GRTN的關鍵技術-雙向實時消息網
圖片

有了控制面的路徑規劃和策略控制,如何快速準確的下發到數據面的每個節點,每個機器也是挑戰。在RTC場景下有一個比較經常使用的功能是客戶端網絡的Mobility,好比用戶在開會的過程當中回家或是離開家的時候手機網絡須要在4G和wifi之間切換,另外考慮客戶端接入的CDN節點出現異常的時候,這兩種狀況都會形成客戶端在和GRTN通訊過程當中切換接入節點,GRTN構建的雙向的實時信令網可以作到切網消息的毫秒級傳遞,當有一個發佈端的媒體流發生網絡切換後,訂閱的客戶端對GRTN內部發生的切換行爲是徹底無感知的。

GRTN的關鍵技術-流媒體孿生
圖片

李松林介紹:GRTN借鑑數字孿生的思想設計了一個流媒體孿生(Streamimg Media Digital Twin)系統,用於容量評估、算法訓練、事件覆盤和模擬壓測等。經過將系統分紅現實和虛擬兩個環境。現實環境複雜收集真實的場景和數據,虛擬環境負責作容量評估和算法訓練。當修改了新的策略以後能夠經過現實的歷史數據輸入到虛擬環境中應用新的算法。經過數據處理,生成數據報表對比以前這些數據在真實環境中的狀況。這樣就能夠指導新的算法調優,也能夠評估新算法是否有效。

GRTN的關鍵技術-可編程
圖片

媒體技術的上層業務場景很是豐富,好比電商直播、視頻會議、在線教育、企業直播、新零售等,所以有不少定製化開發的需求。可編程化改造是GRTN在提高系統穩定性上的一次嘗試,目前GRTN的中心流媒體大腦,節點側的業務模塊,媒體數據發送模塊、媒體信令處理模塊等都已經進行了可編程化改造,大部分狀況下均可以免二進制的發佈。

GRTN的關鍵技術-全鏈路可視化監測
圖片

李松林認爲,可觀測性是評估一個系統是否能夠對外服務的基礎。當線上出現問題能夠及時快速的定位和處理,避免影響擴大。同時也能夠經過觀測系統收集數據,不斷優化系統。

基於GRTN打造超低延時直播RTS
圖片

爲了更加方便客戶和行業擁抱GRTN,阿里雲基於GRTN打造了超低延時直播服務RTS,其有四個技術特性:
秒級延時和卓越的抗弱網能力,在相同卡頓率下延時能夠下降80%,相比於傳統的RTMP和FLV的5-10s延時,RTS的延時能夠達到1s之內,而且還在基於線上的大數據,在自我學習和持續迭代中。

成熟穩定,RTS歷經2年多時間的潛心研發,並經歷了淘寶直播618大促的線上考驗,目前已經在淘寶直播上線。

開放標準,爲了可以方便自研播放器的客戶使用咱們的RTS服務,阿里雲的WebRTC接入的信令協議的徹底開放的、透明的。

廣覆蓋和高併發,RTS服務是構建在阿里雲2800+邊緣節點之上,能夠支持千萬級併發播放。

李松林還分享了具體案例:淘寶直播在2020年雙11首次大規模使用全球實時傳輸網絡GRTN的技術,交互體驗獲得了極大的改善,成交轉化率獲得提升,直播帶貨GMV提高了5%。面向將來,愈來愈多的直播應用到人們的生活中,阿里雲將持續加碼直播領域技術創新,打通直播的最後一千米,依託遍及全球2800+邊緣雲節點,提供穩定、可靠、安全的直播服務,面向用戶打造更接近真實場景的直播體驗。

相關文章
相關標籤/搜索