RTP協議

http://www.360doc.com/content/11/1009/15/496343_154624612.shtml

http://www.cnblogs.com/qingquan/archive/2011/07/28/2120440.htmlhtml

 

RTP協議

1 RTP報文格式 ios

2 基於RTP的帶寬控制方法 算法

     1. 接收端的控制策略 緩存

     2. 發送端的控制策略安全


   RTP(Real-time Transport Protocol)是由IETF開發的實時傳輸協議,能夠在面向鏈接或無鏈接的下層協議上工做,一般和UDP協議一塊兒使用。RTP的工做機理與RSVP不一樣,主要實現一種端到端的多媒體流同步控制機制,既不須要事先創建鏈接,也不須要中間節點的參與,爲其保留資源。在網絡帶寬充足的狀況下,RTP具備必定的帶寬調控能力,保證端到端的多媒體流同步。在網絡帶寬不足時,RTP的帶寬調控能力將受到必定的限制。ITU(國際電信聯合會)的視頻會議標準 H.323採用了RTP協議。服務器

   RTP定義了兩種報文:RTP報文和RTCP報文,RTP報文用於傳送媒體數據(如音頻和視頻),它由 RTP報頭和數據兩部分組成,RTP數據部分稱爲有效載荷(payload);RTCP報文用於傳送控制信息,以實現協議控制功能。RTP報文和RTCP 報文將做爲下層協議的數據單元進行傳輸。若是使用UDP,則RTP報文和RTCP報文分別使用兩個相鄰的UDP端口,RTP報文使用低端口,RTCP報文使用高端口。若是使用其它的下層協議,RTP報文和RTCP報文能夠合併,放在一個數據單元中一塊兒傳送,控制信息在前,媒體數據在後。一般,RTP是由應用程序實現的。網絡


 

1 RTP報文格式

    RTP報文由兩部分組成:報頭和有效載荷。RTP報頭格式以下圖所示,其中:app

 

 

 

    ·V:RTP協議的版本號,佔2位,當前協議版本號爲2。框架

    ·P:填充標誌,佔1位,若是P=1,則在該報文的尾部將填充一個或多個額外的八位組,它們不是有效載荷的一部分。tcp

    ·X:擴展標誌,佔1位,若是X=1,則在RTP報頭後跟有一個擴展報頭。

    ·CC:CSRC計數器,佔 4位,指示CSRC 標識符的個數。

    ·M: 標記,佔1位,不一樣的有效載荷有不一樣的含義,對於視頻,標記一幀的結束;對於音頻,標記會話的開始。

    ·PT: 有效載荷類型,佔7位,用於說明RTP報文中有效載荷的類型,如GSM音頻、JPEM圖像等。

    ·序列號:佔16位,用於標識發送者所發送的RTP報文的序列號,每發送一個報文,序列號增1。接收者經過序列號來檢測報文丟失狀況,從新排序報文,恢復數據。

    ·時戳 (Timestamp):佔32位,時戳反映了該RTP報文的第一個八位組的採樣時刻。接收者使用時戳來計算延遲和延遲抖動,並進行同步控制。

    ·同步信源(SSRC)標識符:佔32位,用於標識同步信源。該標識符是隨機選擇的,參加同一視頻會議的兩個同步信源不能有相同的SSRC。

    ·特約信源(CSRC)標識符:每一個CSRC標識符佔32位,能夠有0~15個。每一個CSRC標識了包含在該RTP報文有效載荷中的全部特約信源。

    這裏的同步信源是指產生媒體流的信源,它經過RTP報頭中的一個32位數字SSRC標識符來標識,而不依賴於網絡地址,接收者將根據SSRC標識符來區分不一樣的信源,進行RTP報文的分組。特約信源是指當混合器接收到一個或多個同步信源的RTP報文後,通過混合處理產生一個新的組合RTP報文,並把混合器做爲組合RTP報文的 SSRC,而將原來全部的SSRC都做爲CSRC傳送給接收者,使接收者知道組成組合報文的各個SSRC。

    在發送端,上層應用程序以分組形式將編碼後的媒體數據傳給RTP通訊模塊,做爲RTP報文的有效載荷,RTP通訊模塊將根據上層應用提供的參數在有效載荷前添加RTP報頭,造成 RTP報文,經過Socket接口選擇UDP協議發送出去。

    在接收端,RTP通訊模塊經過Socket接口接收到RTP報文後,將RTP報頭分離出來做相應處理,再將RTP報文的有效載荷做爲數據分組傳遞給上層應用。

    考慮到在Internet這種複雜的環境中舉行視頻會議,RTP定義了兩種中間系統:混合器(Mixer)和轉換器(Translator)。

    在Internet上舉行視頻會議時,可能有少數參加者經過低速鏈路與使用高速網絡的多數參加者相鏈接。爲了避免強制全部會議參加者都使用低帶寬和低質量的數據編碼,RTP容許在低帶寬區域附近使用混合器做爲RTP級中繼器。混合器從一個或多個信源接收RTP 報文,對到達的數據報文進行從新同步和從新組合,這些重組的數據流被混合成一個數據流,將數據編碼轉化爲在低帶寬上可用的類型,並經過低速鏈路向低帶寬區域轉發。爲了對多個輸入信源進行統一的同步,混合器在多個媒體流之間進行定時調整,產生它本身的定時同步,所以全部從混合器輸出的報文都把混合器做爲同步信源。爲了保證接收者可以正確識別混合器處理前的原始報文發送者,混合器在RTP報頭中設置了CSRC標識符隊列,以標識那些產生混和報文的原始同步信源。

    在Internet環境中,一些會議的參加者可能被隔離在應用級防火牆的外面,這些參加者被禁止直接使用 IP組播地址進行訪問,雖然他們多是經過高速鏈路鏈接的。在這些狀況下,RTP容許使用轉換器做爲RTP級中繼器。在防火牆兩端分別安裝一個轉換器,防火牆以外的轉換器過濾全部接收到的組播報文,並經過一條安全的鏈接傳送給防火牆以內的轉換器,內部轉換器將這些組播報文再轉發送給內部網絡中的組播組成員。


 

2 基於RTP的帶寬控制方法

    爲了實時傳輸數據,RTP利用了簡單而快捷的UDP協議實現網絡傳輸。因爲UDP協議是一種無鏈接傳輸協議,不保證報文傳輸的正確性和有序性,也不提供流量控制功能。另外一方面,在多媒體通訊中,因爲多媒體數據的特殊性,不宜採用一般的重傳糾錯法來提供正確性,而是採用控制傳送帶寬方式來減小報文丟失,以知足多媒體應用所需的QoS。

 

    在RTP協議中,經過 RTCP報文提供了基於無鏈接傳輸協議的端到端控制機制,這是一種基於接收者反饋的網絡傳輸QoS監測機制,在RTCP的接收報告中包含了當前網絡傳輸 QoS有關信息,如報文丟失率、報文丟失累計、接收到的最高序列號、平均延遲抖動以及用於計算髮布接收報告往返所需時間的時間標籤等。發送者可經過這些信息監測和評價網絡傳輸QoS情況,並可採起適當的策略實施同步控制。 

    RTP協議規定,每一個RTP 系統必須實現RTCP的控制功能,由內部功能模塊按期自動執行。RTCP報文是輕載信息,其信息量與最低的數據通訊量相平衡,它所產生的通訊量只是數據通訊量的5%左右。

    要實施端到端的強制同步控制,其前提條件是發送端要可以獲取網絡失調狀態信息。一種可行的同步控制策略是:各個接收端將一種輕載的網絡失調狀態信息(如 QoS參數狀態)反饋給發送端,發送端據此進行強制性同步控制,以知足接收端演示質量的要求。 

    基於RTP的帶寬控制算法正是利用這種控制策略來實施強制性同步控制的,其基本思想是在RTP協議機制支持下,發送端經過接收端週期反饋的接收報告來評價當前網絡傳輸的QoS,並以此對數據發送速率進行適當調整。端點之間利用RTP報文和RTCP報文來實現帶寬控制:

 

    (1) RTP報文的序號字段可用於排序RTP報文分組,以消除重複分組,保持視頻或音頻流內同步和連續地播放。

   (2)RTP報文的時戳字段可做爲流間同步標識,以保持視頻和音頻流間同步和連續地播放。 

    (3) 發送者可利用接收者反饋的RTCP報文來制實施端到端的強制性同步控制,以改善當前網絡傳輸的QoS。


2.1.接收端的控制策略

    接收端經過RTP協議實施以下的控制策略:

 

    ①SSRC字段用於標識不一樣的信源,以支持多對一或多對多的多媒體通訊。

   ②時戳字段做爲流間同步標識,用於媒體流間的流間控制,以保持視頻和音頻流間同步和連續地播放,並做爲時間量用於計算報文分組的傳輸延時、延時抖動以及數據更新週期等,濾除嚴重延時的RTP報文分組。 

    ③序號字段做爲流內同步標識,用於排序RTP報文分組,消除重複報文分組,保持視頻或音頻流內同步和連續地播放。

   ④將接收端檢測到的當前網絡 QoS情況經過RTCP的接收報告週期地反饋給發送端。 


2.2.發送端的控制策略

    發送端將採用以下的控制算法來調整傳送帶寬。

 

    ①設bs爲發送端當前的帶寬,bmin和bmax分別爲應用所設置的最小帶寬和最大帶寬,且bs?[bmin,bmax]。

   ②在每一個發送帶寬級上保持一個時間片,超時後將根據網絡QoS情況提升或下降一個帶寬級,以免帶寬頻繁波動。這裏使用報文丟失率做爲QoS指示器,並設置一個閾值。若是QoS指示器超閾,說明網絡發生阻塞,經過改變發送速率來調整傳送帶寬,疏導網絡交通。 

    ③初始時按最大帶寬發送報文分組,即bs?bmax,以提升網絡通道的利用率。 

    ④若是在規定的時間片內 QoS指示器超閾,說明網絡發生阻塞,則在超時後須要下降一個帶寬級,即bs? max { bs-μ, bmin },其中μ爲比例因子。

   ⑤若是在規定的時間片內 QoS指示器未超閾,說明網絡交通情況良好,則在超時後應當提升一個帶寬級,即bs? min { bs+μ, bmax }。 

    ⑥在點到多點通訊場合中,發送者將面對多個不一樣網段上的接收者,而每一個網段的交通情況又不盡相同。所以,在改變帶寬時可採用多數表決法,即當報文丟失率超閾的接收者超過必定比例時再改變帶寬。

    這種方法的特色是:利用 RTP協議機制來傳送網絡狀態信息,不須要另外構造網絡檢測機構,易於實現;RTCP報文是一種輕載報文,佔用較少的通訊帶寬。


RTP與RTCP協議介紹

 
 
 
1 流媒體( Streaming Media)
1.1流媒體概念
流媒體技術是網絡技術和多媒體技術發展到必定階段的產物。術語流媒體既能夠指在網上傳輸連續時基媒體的流式技術,也能夠指使用流式技術的連續時基媒體自己。在網上傳輸音頻、視頻等多媒體信息目前主要有兩種方式:下載和流式傳輸。採用下載方式,用戶須要先下載整個媒體文件,而後才能進行播放。因爲網絡帶寬的限制,下載經常要花很長時間,因此這種處理方式延遲很大。而流媒體實現的關鍵技術是流式傳輸。傳輸以前首先對多媒體進行預處理(下降質量和高效壓縮) ,而後使用緩存系統來保證數據連續正確地進行傳輸。使用流式傳輸方式,用戶沒必要像採用下載方式那樣要等到整個文件所有下載完畢,而是隻需通過幾秒到幾十秒的啓動延時便可在客戶端進行播放和觀看。此時媒體文件的剩餘部分將在後臺繼續下載。與單純的下載方式相比,這種對多媒體文件邊下載邊播放的流式傳輸方式不只使啓動延時大幅度地縮短,並且對系統緩存容量的需求也大大下降。使用流式傳輸的另外一個好處是使傳輸那些事先不知道或沒法知道大小的媒體數據(如網上直播、視頻會議等) 成爲可能。
到目前爲止,Internet 上使用較多的流式視頻格式主要有如下三種:RealNetworks 公司的RealMedia ,Apple 公司的QuickTime 以及Microsoft 公司的Advanced Streaming Format (ASF) 。
 
1.2支持流媒體的協議
多媒體應用的一個顯著特色是數據量大,而且許多應用對實時性要求比較高。傳統的TCP 協議是一個面向鏈接的協議,它的重傳機制和擁塞控制機制都是不適用於實時多媒體傳輸的。RTP是一個應用型的傳輸層協議,它並不提供任何傳輸可靠性的保證和流量的擁塞控制機制。RTP 位於UDP(User Datagram Protocol) 之上。UDP 雖然沒有TCP 那麼可靠,而且沒法保證明時業務的服務質量,須要RTCP 實時監控數據傳輸和服務質量。可是,因爲UDP 的傳輸時延低於TCP ,能與音頻和視頻很好地配合。所以,在實際應用中,RTP/ RTCP/ UDP 用於音頻/ 視頻媒體,而TCP 用於數據和控制信令的傳輸。目前,支持流媒體傳輸的協議主要有實時傳輸協議RTP( Real-Time Transport Protocol) 、實時傳輸控制協議RTCP(Real-Time Transport Control Protocol) 和實時流協議RTSP(Real-Time Streaming Protocol) 等。下面分別對這三種協議做簡要介紹。流媒體協議棧如圖1 所示。
圖1 流媒體協議棧
 
 
2 實時傳輸協議RTP( Real-Time Transport Protocol ):
RTP是針對Internet上多媒體數據流的一個傳輸協議, 由IETF(Internet工程任務組)做爲RFC1889發佈。RTP被定義爲在一對一或一對多的傳輸狀況下工做,其目的是提供時間信息和實現流同步。RTP的典型應用創建在UDP上,但也能夠在TCP或ATM等其餘協議之上工做。RTP自己只保證明時數據的傳輸,並不能爲按順序傳送數據包提供可靠的傳送機制,也不提供流量控制或擁塞控制,它依靠RTCP提供這些服務。
 
2.1 RTP工做機制
威脅多媒體數據傳輸的一個尖銳的問題就是不可預料數據到達時間。可是流媒體的傳輸是須要數據的適時的到達用以播放和回放。rtp協議就是提供了時間標籤,序列號以及其它的結構用於控制適時數據的流放。在流的概念中」時間標籤」是最重要的信息。發送端依照即時的採樣在數據包裏隱蔽的設置了時間標籤。在接受端收到數據包後,就依照時間標籤按照正確的速率恢復成原始的適時的數據。不一樣的媒體格式調時屬性是不同的。可是rtp自己並不負責同步,rtp只是傳輸層協議,爲了簡化運輸層處理,提升該層的效率。將部分運輸層協議功能(好比流量控制)上移到應用層完成。同步就是屬於應用層協議完成的。它沒有運輸層協議的完整功能,不提供任何機制來保證明時地傳輸數據,不支持資源預留,也不保證服務質量。rtp報文甚至不包括長度和報文邊界的描述。同時rtp協議的數據報文和控制報文的使用相鄰的不一樣端口,這樣大大提升了協議的靈活性和處理的簡單性。
rtp協議和udp兩者共同完成運輸層協議功能。udp協議只是傳輸數據包,無論數據包傳輸的時間順序。 rtp的協議數據單元是用udp分組來承載的。在承載rtp數據包的時候,有時候一幀數據被分割成幾個包具備相同的時間標籤,則能夠知道時間標籤並非必須的。而udp的多路複用讓rtp協議利用支持顯式的多點投遞,能夠知足多媒體會話的需求。
rtp協議雖然是傳輸層協議可是它沒有做爲osi體系結構中單獨的一層來實現。rtp協議一般根據一個具體的應用來提供服務,rtp只提供協議框架,開發者能夠根據應用的具體要求對協議進行充分的擴展。
 
2.2  RTP協議的報文結構
RTP頭格式如圖2所示:
 
 
開始12個八進制出如今每一個RTP包中,而CSRC標識列表僅出如今混合器插入時。各段含義以下:
①版本(V)
2位,標識RTP版本。
 
②填充標識(P)
1位,如設置填充位,在包尾將包含附加填充字,它不屬於有效載荷。填充的最後一個八進制包含應該忽略的八進制計數。某些加密算法須要固定大小的填充字,或爲在底層協議數據單元中攜帶幾個RTP包。
 
③擴展(X)
1位,如設置擴展位,固定頭後跟一個頭擴展。
 
④CSRC計數(CC)
4位,CSRC計數包括緊接在固定頭後CSRC標識符個數。
 
⑤標記(M)
1位,標記解釋由設置定義,目的在於容許重要事件在包流中標記出來。設置可定義其餘標示位,或經過改變位數量來指定沒有標記位。
 
⑥載荷類型(PT)
7位,記錄後面資料使用哪一種 Codec , receiver 端找出相應的 decoder 解碼出來。
 
經常使用 types:
Payload Type
Codec
0
PCM μ -Law
8
PCM-A Law
9
G..722 audio codec
4
G..723 audio codec
15
G..728 audio codec
18
G..729 audio codec
34
G..763 audio codec
31
G..761 audio codec
 
⑦系列號
16位,系列號隨每一個RTP數據包而增長1,由接收者用來探測包損失。系列號初值是隨機的,使對加密的文本攻擊更加困難。
 
⑧時標
32位,時標反映RTP數據包中第一個八進制數的採樣時刻,採樣時刻必須從單調、線性增長的時鐘導出,以容許同步與抖動計算。時標可讓receiver端知道在正確的時間將資料播放出來。
 
由上圖可知,若是隻有系列號,並不能完整按照順序的將data播放出來,由於若是data中間有一段是沒有資料的,只有系列號的話會形成錯誤,需搭配上讓它知道在哪一個時間將data正確播放出來,如此咱們才能播放出正確無誤的信息。
 
⑨SSRC
32位,SSRC段標識同步源。此標識不是隨機選擇的,目的在於使同一RTP包鏈接中沒有兩個同步源有相同的SSRC標識。儘管多個源選擇同一個標識的機率很低,全部RTP實現都必須探測並解決衝突。如源改變源傳輸地址,也必須選擇一個新SSRC標識以免插入成環行源。
 
⑩CSRC列表
0到15項,每項32位。CSRC列表表示包內的對載荷起做用的源。標識數量由CC段給出。如超出15個做用源,也僅標識15個。CSRC標識由混合器插入,採用做用源的SSRC標識。
 
3 .實時傳輸控制協議RTCP(Real-Time Transport Control Protocol)
RTCP負責管理傳輸質量在當前應用進程之間交換控制信息。在RTP會話期間,各參與者週期性地傳送RTCP包,包中含有已發送的數據包的數量、丟失的數據包的數量等統計資料。所以,服務器能夠利用這些信息動態地改變傳輸速率,甚至改變有效載荷類型。RTP和RTCP配合使用,能以有效的反饋和最小的開銷使傳輸效率最佳化,故特別適合傳送網上的實時數據。
 
3.1 RTCP工做機制
當應用程序開始一個rtp會話時將使用兩個端口:一個給rtp,一個給rtcp。rtp自己並不能爲按順序傳送數據包提供可靠的傳送機制,也不提供流量控制或擁塞控制,它依靠rtcp提供這些服務。在rtp的會話之間週期的發放一些rtcp包以用來傳監聽服務質量和交換會話用戶信息等功能。rtcp包中含有已發送的數據包的數量、丟失的數據包的數量等統計資料。所以,服務器能夠利用這些信息動態地改變傳輸速率,甚至改變有效載荷類型。rtp和rtcp配合使用,它們能以有效的反饋和最小的開銷使傳輸效率最佳化,於是特別適合傳送網上的實時數據。根據用戶間的數據傳輸反饋信息,能夠制定流量控制的策略,而會話用戶信息的交互,能夠制定會話控制的策略。
 
3.2 RTCP數據報
在RTCP通訊控制中,RTCP協議的功能是經過不一樣的RTCP數據報來實現的,主要有以下幾種類型:
①SR:發送端報告,所謂發送端是指發出RTP數據報的應用程序或者終端,發送端同時也能夠是接收端。
②RR:接收端報告,所謂接收端是指僅接收但不發送RTP數據報的應用程序或者終端。
③SDES:源描述,主要功能是做爲會話成員有關標識信息的載體,如用戶名、郵件地址、電話號碼等,此外還具備向會話成員傳達會話控制信息的功能。
④BYE:通知離開,主要功能是指示某一個或者幾個源再也不有效,即通知會話中的其餘成員本身將退出會話。
⑤APP:由應用程序本身定義,解決了RTCP的擴展性問題,而且爲協議的實現者提供了很大的靈活性。
 
4 資源預訂協議RSVP (Resorce Reservation Protocol)
因爲音頻和視頻數據流比傳統數據對網絡的延時更敏感,要在網絡中傳輸高質量的音頻、視頻信息,除帶寬要求以外,還需其餘更多的條件。RSVP是Internet上的資源預訂協議,使用RSVP預留部分網絡資源(即帶寬),能在必定程度上爲流媒體的傳輸提供QoS。

RTP協議分析

第1章.     RTP概述

1.1.  RTP是什麼

RTP全名是Real-time Transport Protocol(實時傳輸協議)。它是IETF提出的一個標準,對應的RFC文檔爲RFC3550RFC1889爲其過時版本)。RFC3550不只定義了RTP,並且定義了配套的相關協議RTCPReal-time Transport Control Protocol,即實時傳輸控制協議)。RTP用來爲IP網上的語音、圖像、傳真等多種須要實時傳輸的多媒體數據提供端到端的實時傳輸服務。RTPInternet上端到端的實時傳輸提供時間信息和流同步,但並不保證服務質量,服務質量由RTCP來提供。

1.2.  RTP的應用環境

RTP用於在單播或多播網絡中傳送實時數據。它們典型的應用場合有以下幾個。

簡單的多播音頻會議。語音通訊經過一個多播地址和一對端口來實現。一個用於音頻數據(RTP),另外一個用於控制包(RTCP)。

音頻和視頻會議。若是在一次會議中同時使用了音頻和視頻會議,這兩種媒體將分別在不一樣的RTP會話中傳送,每個會話使用不一樣的傳輸地址(IP地址+端口)。若是一個用戶同時使用了兩個會話,則每一個會話對應的RTCP包都使用規範化名字CNAMECanonical Name)。與會者能夠根據RTCP包中的CNAME來獲取相關聯的音頻和視頻,而後根據RTCP包中的計時信息(Network time protocol)來實現音頻和視頻的同步。

翻譯器和混合器。翻譯器和混合器都是RTP級的中繼系統。翻譯器用在經過IP多 播不能直接到達的用戶區,例如發送者和接收者之間存在防火牆。當與會者能接收的音頻編碼格式不同,好比有一個與會者經過一條低速鏈路接入到高速會議,這 時就要使用混合器。在進入音頻數據格式須要變化的網絡前,混合器未來自一個源或多個源的音頻包進行重構,並把重構後的多個音頻合併,採用另外一種音頻編碼進 行編碼後,再轉發這個新的RTP包。從一個混合器出來的全部數據包要用混合器做爲它們的同步源(SSRC,見RTP的封裝)來識別,能夠經過貢獻源列表(CSRC表,見RTP的封裝)能夠確認談話者。

1.3.  相關概念

1.3.1.  流媒體

流媒體是指Internet上使用流式傳輸技術的連續時基媒體。當前在Internet上傳輸音頻和視頻等信息主要有兩種方式:下載和流式傳輸兩種方式。

下載狀況下,用戶須要先下載整個媒體文件到本地,而後才能播放媒體文件。在視頻直播等應用場合,因爲生成整個媒體文件要等直播結束,也就是用戶至少要在直播結束後才能看到直播節目,因此用下載方式不能實現直播。

流式傳輸是實現流媒體的關鍵技術。使用流式傳輸能夠邊下載邊觀看流媒體節目。因爲Internet是基於分組傳輸的,因此接收端收到的數據包每每有延遲和亂序(流式傳輸構建在UDP上)。要實現流式傳輸,就是要從下降延遲和恢復數據包時序入手。在發送端,爲下降延遲,每每對傳輸數據進行預處理(下降質量和高效壓縮)。在接收端爲了恢復時序,採用了接收緩衝;而爲了實現媒體的流暢播放,則採用了播放緩衝。

使用接收緩衝,能夠將接收到的數據包緩存起來,而後根據數據包的封裝信息(如包序號和時戳等),將亂序的包從新排序,最後將從新排序了的數據包放入播放緩衝播放。

爲何須要播放緩衝呢?容易想到,因爲網絡不可能很理想,而且對數據包排序須要處理時耗,咱們獲得排序好的數據包的時間間隔是不等的。若是不用播放緩衝,那麼播放節目會很卡,這叫時延抖動。相反,使用播放緩衝,在開始播放時,花費幾十秒鐘先將播放緩衝填滿(例如PPLIVE),能夠有效地消除時延抖動,從而在不太損失實時性的前提下實現流媒體的順暢播放。

到目前爲止,Internet 上使用較多的流式視頻格式主要有如下三種:RealNetworks 公司的RealMedia ,Apple 公司的QuickTime 以及Microsoft 公司的Advanced Streaming Format (ASF) 

上面在談接收緩衝時,說到了流媒體數據包的封裝信息(包序號和時戳等),這在後面的RTP封裝中會有體現。另外,RealMedia這些流式媒體格式只是編解碼有不一樣,但對於RTP來講,它們都是待封裝傳輸的流媒體數據而沒有什麼不一樣。

第2章.     RTP詳解

2.1.  RTP的協議層次

2.1.1.  傳輸層的子層

RTP(實時傳輸協議),顧名思義它是用來提供實時傳輸的,於是能夠當作是傳輸層的一個子層。圖 1給出了流媒體應用中的一個典型的協議體系結構。

 

 

圖 1 流媒體體系結構

從圖中能夠看出,RTP被劃分在傳輸層,它創建在UDP上。同UDP協議同樣,爲了實現其實時傳輸功能,RTP也有固定的封裝形式。RTP用來爲端到端的實時傳輸提供時間信息和流同步,但並不保證服務質量。服務質量由RTCP來提供。這些特色,在第4章能夠看到。

2.1.2.  應用層的一部分

很多人也把RTP歸爲應用層的一部分,這是從應用開發者的角度來講的。操做系統中的TCP/IP等協議棧所提供的是咱們最經常使用的服務,而RTP的實現仍是要靠開發者本身。所以從開發的角度來講,RTP的實現和應用層協議的實現沒不一樣,因此可將RTP當作應用層協議。

RTP實現者在發送RTP數據時,需先將數據封裝成RTP包,而在接收到RTP數據包,須要將數據從RTP包中提取出來。

2.2.  RTP的封裝

一個協議的封裝是爲了知足協議的功能需求的。從前面提出的功能需求,能夠推測出RTP封裝中應該有同步源和時戳等字段,但更爲完整的封裝是什麼樣子呢?請看圖2

 

 2 RTP的頭部格式

版本號(V):2比特,用來標誌使用的RTP版本。

填充位(P):1比特,若是該位置位,則該RTP包的尾部就包含附加的填充字節。

擴展位(X):1比特,若是該位置位的話,RTP固定頭部後面就跟有一個擴展頭部。

CSRC計數器(CC):4比特,含有固定頭部後面跟着的CSRC的數目。

標記位(M):1比特,該位的解釋由配置文檔(Profile)來承擔.

載荷類型(PT):7比特,標識了RTP載荷的類型。

序列號(SN):16比特,發送方在每發送完一個RTP包後就將該域的值增長1,接收方能夠由該域檢測包的丟失及恢復包序列。序列號的初始值是隨機的。

時間戳:32比特,記錄了該包中數據的第一個字節的採樣時刻。在一次會話開始時,時間戳初始化成一個初始值。即便在沒有信號發送時,時間戳的數值也要隨時間而不斷地增長(時間在流逝嘛)。時間戳是去除抖動和實現同步不可缺乏的。

同步源標識符(SSRC)32比特,同步源就是指RTP包流的來源。在同一個RTP會話中不能有兩個相同的SSRC值。該標識符是隨機選取的 RFC1889推薦了MD5隨機算法。

貢獻源列表(CSRC List):015項,每項32比特,用來標誌對一個RTP混合器產生的新包有貢獻的全部RTP包的源。由混合器將這些有貢獻的SSRC標識符插入表中。SSRC標識符都被列出來,以便接收端能正確指出交談雙方的身份。

2.3.  RTCP的封裝

RTP須要RTCP爲其服務質量提供保證,所以下面介紹一下RTCP的相關知識。

RTCP的主要功能是:服務質量的監視與反饋、媒體間的同步,以及多播組中成員的標識。在RTP會話期 間,各參與者週期性地傳送RTCP包。RTCP包中含有已發送的數據包的數量、丟失的數據包的數量等統計資料,所以,各參與者能夠利用這些信息動態地改變傳輸速率,甚至改變有效載荷類型。RTPRTCP配合使用,它們能以有效的反饋和最小的開銷使傳輸效率最佳化,於是特別適合傳送網上的實時數據。

從圖 1能夠看到,RTCP也是用UDP來傳送的,但RTCP封裝的僅僅是一些控制信息,於是分組很短,因此能夠將多個RTCP分組封裝在一個UDP包中。RTCP有以下五種分組類型。

類型

縮寫表示

用途

200

SRSender Report

發送端報告

201

RRReceiver Report

接收端報告

202

SDESSource Description Items

源點描述

203

BYE

結束傳輸

204

APP

特定應用

表 1 RTCP的5種分組類型

上述五種分組的封裝大同小異,下面只講述SR類型,而其它類型請參考RFC3550

發送端報告分組SRSender Report)用來使發送端以多播方式向全部接收端報告發送狀況。SR分組的主要內容有:相應的RTP流的SSRCRTP流中最新產生的RTP分組的時間戳和NTPRTP流包含的分組數,RTP流包含的字節數。SR包的封裝如圖3所示。

 

 3 RTCP頭部的格式

版本(V):同RTP包頭域。

填充(P):同RTP包頭域。

接收報告計數器(RC):5比特,該SR包中的接收報告塊的數目,能夠爲零。

包類型(PT):8比特,SR包是200

長度域(Length):16比特,其中存放的是該SR包以32比特爲單位的總長度減一。

同步源(SSRC):SR包發送者的同步源標識符。與對應RTP包中的SSRC同樣。

NTP TimestampNetwork time protocolSR包發送時的絕對時間值。NTP的做用是同步不一樣的RTP媒體流。

RTP Timestamp:與NTP時間戳對應,與RTP數據包中的RTP時間戳具備相同的單位和隨機初始值。

Senders packet count:從開始發送包到產生這個SR包這段時間裏,發送者發送的RTP數據包的總數. SSRC改變時,這個域清零。

Sender`s octet count:從開始發送包到產生這個SR包這段時間裏,發送者發送的淨荷數據的總字節數(不包括頭部和填充)。發送者改變其SSRC時,這個域要清零。

同步源nSSRC標識符:該報告塊中包含的是從該源接收到的包的統計信息。

丟失率(Fraction Lost):代表從上一個SRRR包發出以來從同步源n(SSRC_n)來的RTP數據包的丟失率。

累計的包丟失數目:從開始接收到SSRC_n的包到發送SR,SSRC_n傳過來的RTP數據包的丟失總數。

收到的擴展最大序列號:從SSRC_n收到的RTP數據包中最大的序列號,

接收抖動(Interarrival jitter):RTP數據包接受時間的統計方差估計

上次SR時間戳(Last SR,LSR):取最近從SSRC_n收到的SR包中的NTP時間戳的中間32比特。若是目前還沒收到SR包,則該域清零。

上次SR以來的延時(Delay since last SR,DLSR):上次從SSRC_n收到SR包到發送本報告的延時。

2.4.  RTP的會話過程

當應用程序創建一個RTP會話時,應用程序將肯定一對目的傳輸地址。目的傳輸地址由一個網絡地址和一對端口組成,有兩個端口:一個給RTP包,一個給RTCP包,使得RTP/RTCP數據可以正確發送。RTP數據發向偶數的UDP端口,而對應的控制信號RTCP數據發向相鄰的奇數UDP端口(偶數的UDP端口+1),這樣就構成一個UDP端口對。 RTP的發送過程以下,接收過程則相反。

1)        RTP協議從上層接收流媒體信息碼流(如H.263),封裝成RTP數據包;RTCP從上層接收控制信息,封裝成RTCP控制包。

2)        RTPRTP 數據包發往UDP端口對中偶數端口;RTCPRTCP控制包發往UDP端口對中的接收端口。

第3章.     相關的協議

3.1.  實時流協議RTSP

實時流協議RTSPReal-Time Streaming Protocol)是IETF提出的協議,對應的RFC文檔爲RFC2362

從圖 1能夠看出,RTSP是一個應用層協議(TCP/IP網絡體系中)。它以C/S模式工做,它是一個多媒體播放控制協議,主要用來使用戶在播放流媒體時能夠像操做本地的影碟機同樣進行控制,便可以對流媒體進行暫停/繼續、後退和前進等控制。

3.2.  資源預約協議RSVP

資源預約協議RSVP(Resource Reservation Protocol)IETF提出的協議,對應的RFC文檔爲RFC2208

從圖 1能夠看出,RSVP工做在IP層之上傳輸層之下,是一個網絡控制協議。RSVP經過在路由器上預留必定的帶寬,能在必定程度上爲流媒體的傳輸提供服務質量。在某些試驗性的系統如網絡視頻會議工具vic中就集成了RSVP

第4章.     常見的疑問

4.1.  怎樣重組亂序的數據包

能夠根據RTP包的序列號來排序。

4.2.  怎樣得到數據包的時序

能夠根據RTP包的時間戳來得到數據包的時序。

4.3.  聲音和圖像怎麼同步

根據聲音流和圖像流的相對時間(即RTP包的時間戳),以及它們的絕對時間(即對應的RTCP包中的RTCP),能夠實現聲音和圖像的同步。

4.4.  接收緩衝和播放緩衝的做用

1.3.1所述,接收緩衝用來排序亂序了的數據包;播放緩衝用來消除播放的抖動,實現等時播放。

第5章.     實現方案

ID

Protocol

Captured contents

Account

password

Local telephone

number

Opponents

Telephone

Number

audio

login

logout

36

Rtp

 

 

 

 

 

 

表 2 協議分析要求

 2給出了協議分析要求。容易看出要獲取RTP音頻包中的音頻信息很容易,直接將RTP包的包頭去掉便可。固然,要成功地播放解碼獲取到的音頻流,須要知道其編碼,這可從RTP包包頭的有效載荷類型字段(PT)得到。

第6章.     參考資料

[1]      RFC文檔:RFC3550對應RTP/RTCPRFC2362對應RTSPRFC2208對應RSVP

[2]      http://www.faqs.org/rfcs/,上面有全面的英文RFC文檔

[3]      http://www.cnpaf.net/,有很多協議分析文檔,也有中文RFC文檔,但質量不是特別高。


RTP傳輸中的時間戳

    首先,瞭解幾個基本概念:

    時間戳單位:時間戳計算的單位不是秒之類的單位,而是由採樣頻率所代替的單位,這樣作的目的就是爲了是時間戳單位更爲精準。好比說一個音頻的採樣頻率爲8000Hz,那麼咱們能夠把時間戳單位設爲1 / 8000。
    時間戳增量:相鄰兩個RTP包之間的時間差(以時間戳單位爲基準)。
    採樣頻率:  每秒鐘抽取樣本的次數,例如音頻的採樣率通常爲8000Hz
    幀率:      每秒傳輸或者顯示幀數,例如25f/s

    再看看RTP時間戳課本中的定義:


    RTP包頭的第2個32Bit即爲RTP包的時間戳,Time Stamp ,佔32位。
    時間戳反映了RTP分組中的數據的第一個字節的採樣時刻。在一次會話開始時的時間戳初值也是隨機選擇的。即便是沒有信號發送時,時間戳的數值也要隨時間不 斷的增長。接收端使用時間戳可準確知道應當在什麼時間還原哪個數據塊,從而消除傳輸中的抖動。時間戳還可用來使視頻應用中聲音和圖像同步。
    在RTP協議中並無規定時間戳的粒度,這取決於有效載荷的類型。所以RTP的時間戳又稱爲媒體時間戳,以強調這種時間戳的粒度取決於信號的類型。例如, 對於8kHz採樣的話音信號,若每隔20ms構成一個數據塊,則一個數據塊中包含有160個樣本(0.02×8000=160)。所以每發送一個RTP分 組,其時間戳的值就增長160。

    官方的解釋看懂沒?沒看懂?不要緊,我剛開始也沒看懂,那就聽個人解釋吧。

    首先,時間戳就是一個值,用來反映某個數據塊的產生(採集)時間點的,後採集的數據塊的時間戳確定是大於先採集的數據塊的。有了這樣一個時間戳,就能夠標記數據塊的前後順序。
    第二,在實時流傳輸中,數據採集後馬上傳遞到RTP模塊進行發送,那麼,其實,數據塊的採集時間戳就直接做爲RTP包的時間戳。
    第三,若是用RTP來傳輸固定的文件,則這個時間戳就是讀文件的時間點,依次遞增。這個再也不咱們當前的討論範圍內,暫時不考慮。
    第四,時間戳的單位採用的是採樣頻率的倒數,例如採樣頻率爲8000Hz時,時間戳的單位爲1 / 8000 ,在Jrtplib庫中,有設置時間戳單位的函數接口,而ORTP庫中根據負載類型直接給定了時間戳的單位(音頻負載1/8000,視頻負載1/90000)
    第五,時間戳增量是指兩個RTP包之間的時間間隔,詳細點說,就是發送第二個RTP包相距發送第一個RTP包時的時間間隔(單位是時間戳單位)。
    若是採樣頻率爲90000Hz,則由上面討論可知,時間戳單位爲1/90000,咱們就假設1s鐘被劃分了90000個時間塊,那麼,若是每秒發送25 幀,那麼,每個幀的發送佔多少個時間塊呢?固然是 90000/25 = 3600。所以,咱們根據定義「時間戳增量是發送第二個RTP包相距發送第一個RTP包時的時間間隔」,故時間戳增量應該爲3600。
    在 Jrtplib中好像不須要本身管理時間戳的遞增,由庫內部管理。但在ORTP中每次數據的發送都須要本身傳入時間戳的值,即本身須要每次發完一個RTP 包後,累加時間戳增量,不是很方便,這就須要本身對RTP的時間戳有比較深入地理解,我剛開始就是由於沒搞清楚,隨時設置時間戳增量致使傳輸一直有問題, 困擾我很久。

爲何要使用RTP

一提到流媒體傳輸、一談到什麼視頻監控、視頻會議、語音電話(VOIP),都離不開RTP協議的應用,但當你們都根據經驗或者別人的應用而選擇RTP協議的時候,你可曾想過,爲何咱們要使用RTP來進行流媒體的傳輸呢?爲何咱們必定要用RTP?難道TCP、UDP或者其餘的網絡協議不能達到咱們的要求麼?

本文就是根據我在RTP協議的學習和應用過程當中整理出來的思考,但願對你們有所啓發,同時,也歡迎你們留言探討,提出本身的想法和思考。

1.       維基百科的相關解釋

Reliable protocols, such as the Transmission Control Protocol (TCP), guarantee correct delivery of each bit in the media stream. However, they accomplish this with a system of timeouts and retries, which makes them more complex to implement. It also means that when there is data loss on the network, the media stream stalls while the protocol handlers detect the loss and retransmit the missing data. Clients can minimize this effect by buffering data for display. While delay due to buffering is acceptable in video on demand scenarios, users of interactive applications such as video conferencing will experience a loss of fidelity if the delay that buffering contributes to exceeds 200 ms.

像TCP這樣的可靠傳輸協議,經過超時和重傳機制來保證傳輸數據流中的每個bit的正確性,但這樣會使得不管從協議的實現仍是傳輸的過程都變得很是的複雜。並且,當傳輸過程當中有數據丟失的時候,因爲對數據丟失的檢測(超時檢測)和重傳,會數據流的傳輸被迫暫停和延時。

或許你會說,咱們能夠利用客戶端構造一個足夠大的緩衝區來保證顯示的正常,這種方法對於從網絡播放音視頻來講是能夠接受的,可是對於一些須要實時交互的場合(如視頻聊天、視頻會議等),若是這種緩衝超過了200ms,將會產生難以接受的實時性體驗。

2.  爲何RTP能夠解決上述時延問題

RTP協議是一種基於UDP的傳輸協議,RTP自己並不能爲按順序傳送數據包提供可靠的傳送機制,也不提供流量控制或擁塞控制,它依靠RTCP提供這些服務。這樣,對於那些丟失的數據包,不存在因爲超時檢測而帶來的延時,同時,對於那些丟棄的包,也能夠由上層根據其重要性來選擇性的重傳。好比,對於I幀、P幀、B幀數據,因爲其重要性依次下降,故在網絡情況很差的狀況下,能夠考慮在B幀丟失甚至P幀丟失的狀況下不進行重傳,這樣,在客戶端方面,雖然可能會有短暫的不清晰畫面,但卻保證了實時性的體驗和要求。

3. 多播功能

多播在網絡視頻會議方面有着很普遍的應用,它主要應用於這樣一種環境,即:

 

假 設紅色的圓爲存放有視頻數據的流媒體服務器,其餘的圓爲鏈接到該服務器的各個客戶端,當全部的綠色的客戶端要求同時觀看紅色服務器上的某一個視頻時,若是 服務器爲每一路客戶端單獨創建鏈接進行數據的傳輸,這樣明顯不太合理浪費帶寬,所以,多播技術能夠很好地解決這種問題,即同一份數據,由服務器發送到公共 的多播地址,各個客戶端均監聽同一個多播地址來獲取數據,這樣,既節省了帶寬,同時也保證了各個客戶端所觀看的視頻的同步。

這樣的多播應用TCP協議是不支持的,而RTP協議在最初就是爲了實現相似的視頻會議的應用而誕生的,對其有很是好的支持。

4.  RTP包頭中的流媒體特性

首先,咱們看看RTP的包頭。

 

V ― 版本。識別 RTP 版本。

P ― 填充。設置1時,數據包包含一個或多個附加填充比特,填充比特不屬於有效載荷。
     X ― 擴展位。設置1時,在固定頭後面,跟隨一個頭擴展。
     CSRC Count ― 包含 CSRC 標識符(在固定頭後)的數目。
     M ― 標誌。標誌由描述文件(profile)文件定義。容許在比特流中標記重要的事件,如幀邊界。

Payload Type ― 負載類型。由具體的應用決定其解釋。某些profile 文件規定了從 Payload編碼到 Payload 格式的缺省靜態映射。另外的 Payload Type 編碼也能夠經過非 RTP 方法實現動態定義。

Sequence Number ― 序列號。每發送一個 RTP 數據包,序列號增長1。接收端能夠據此檢測丟包和重建包序列。

Timestamp ―時間戳。反映了RTP 數據包中第一個字節的採樣時間。時鐘頻率依賴於負載數據格式,並在描述文件(profile)中進行描述。

SSRC ― 同步源。該標識符隨機生成,旨在確保在同一個 RTP 會話中不存在兩個同步源具備相同的 SSRC 標識符。

CSRC ― 貢獻源標識符。識別該數據包中的有效載荷的貢獻源。

 

從RTP包頭的規定中,咱們能夠很是清晰地看出,在RTP協議中,添加了很是多專爲流媒體傳輸所使用的特性,更加有助於應用於流媒體的傳輸。

好比用於幀邊界標記的M標誌位,方便接收端快速定位幀邊界;好比負載類型字段,用來告訴接收端(或者播放器)傳輸的是哪一種類型的媒體(例如G.729,H.264,MPEG-4等),這樣接收端(或者播放器)就知道數據流是什麼格式,而後使用對應的解碼器去解碼或者播放;好比時間戳字段,標識了數據流的時間戳,接收端能夠利用這個時間戳來去除由網絡引發的信息包的抖動,而且在接收端爲播放提供同步功能,等等。

所以,相比於直接使用TCP或者UDP來進行流媒體傳輸,這樣一個專門爲傳輸音視頻而誕生的網絡協議更加合適。

5. RTP的profile機制

RTP爲具體的應用提供了很是大的靈活性,它將傳輸協議與具體的應用環境、具體的控制策略分開,傳輸協議自己只提供完成實時傳輸的機制,開發者能夠根據不一樣的應用環境,自主選擇合適的配置環境、以及合適的控制策略。

這裏所說的控制策略指的是你能夠根據本身特定的應用需求,來實現特定的一些RTCP控制算法,好比前面提到的丟包的檢測算法、丟包的重傳策略、一些視頻會議應用中的控制方案等等(這些策略我可能將在後續的文章中進行描述)。

對於上面說的合適的配置環境,主要是指RTP的相關配置和負載格式的定義。RTP協議爲了普遍地支持各類多媒體格式(如 H.264, MPEG-4, MJPEG, MPEG),沒有在協議中體現出具體的應用配置,而是經過profile配置文件以及負載類型格式說明文件的形式來提供。對於任何一種特定的應用,RTP定義了一個profile文件以及相關的負載格式說明,相關的文件以下所示:

《RTP Profile for Audio and Video Conferences with Minimal Control》(RFC3551)

《RTP Payload Format for H.264 Video》(RFC3984)

《RTP Payload Format for MPEG-4 Audio/Visual Streams》(RFC3016)

等等,想了解更多能夠點擊這裏:http://en.wikipedia.org/wiki/RTP_audio_video_profile

說明,若是應用程序不使用專有的方案來提供有效載荷類型(payload type)、順序號或者時間戳,而是使用標準的RTP協議,應用程序就更容易與其餘的網絡應用程序配合運行,這是你們都但願的事情。例如,若是有兩個不一樣的公司都在開發因特網電話軟件,他們都把RTP合併到他們的產品中,這樣就有但願:使用不一樣公司電話軟件的用戶之間可以進行通訊。

6. RTP其餘的一些良好特性

(1)RTP協議在設計上考慮到安全功能,支持加密數據和身份驗證功能。

(2)有較少的首部開銷

     TCP和XTP相對RTP來講具備過多的首部開銷(TCP和XTP3.6是40字節,XTP4.0是32字節,而RTP只有12字節)

(3)……(等待補充)

7. 相關資源列表

這裏有些相關的RTP資源,但願對你們有所幫助。

(1)維基百科對RTP的介紹:

   http://en.wikipedia.org/wiki/Real-time_Transport_Protocol

(2)維基百科對流媒體的介紹:

   http://en.wikipedia.org/wiki/Streaming_media

(3)stackoverflows論壇關於RTP vs TCP的討論

   http://stackoverflow.com/questions/361943/why-does-rtp-use-udp-instead-of-tcp

(4)關於RTP的負載類型和時間戳的講解

   http://ticktick.blog.51cto.com/823160/350142

  (5) RTP FAQ

   Some Frequently Asked Questions about RTP


IP/TCP/UDP/RTP/RTCP包結構圖

IP 包頭結構:

 

TCP 包頭結構:

UDP 包頭結構: 

 

RTP 包頭結構:

 

RTCP 包頭結構:

 

 

 另附RTP/UDP/TCP協議總結:http://wenku.baidu.com/view/3580ad6648d7c1c708a145e1.html

相關文章
相關標籤/搜索