音視頻技術學習 - 啓動篇

時間 2019-11-06

標籤音視頻技術學習啓動简体版

原文原文鏈接

其實老早就想寫一些關於音視頻學習的文章了，但因爲各方面的緣由遲遲都沒有開始。一個方面是由於筆者寫文章都是成系統的，音視頻須要你們有必定的 c/c++ 基礎；還有一個方面是由於以前經驗不足，這一塊涉及到的細節也比較多。我本身學習時看過大量的文章和資料，這裏推薦雷霄驊的專欄，雖然文章的更新永遠停在了那一刻，但其無私分享的精神值得咱們每個開發者學習。音視頻這系列文章咱們打算從基礎開始學，而後結合移動端 NDK 來開發。所以若是你已是音視頻開發的老司機，那麼本文可能不太適合你，其次若是以前沒了解過 NDK 開發，學習起來也可能會有些難度。linux

目前市面上咱們所熟悉的音視頻開發大體有：視頻播放器、短視頻、視音頻直播 等等，他們之間有不少的共性像音視頻編解碼、視音頻同步等，所以咱們首先來看下這些共性內容。假設咱們如今要播放一個本地視頻，須要通過哪些步驟呢？你們不妨本身先思考一下，固然這裏不是說集成 ijkplayer 或者 ExoPlayer 等開源庫，目前只給一個 SurfaceView 和一個視頻文件，在此基礎上實現一個視頻播放。咱們先來看一個簡單的流程圖：c++

上面這張圖咱們務必得要記在內心，想必理解這麼一張圖對於你們來講應該 soEasy 。不少東西都是一通百通的，以前就講過怎麼解析一張圖片，咱們再渙散一下思惟，假如去解析加載一個 dex/class 文件呢？基於上面這個圖，咱們再來看一些具體的細節：git

解封裝github

將輸入的封裝格式的數據(文件)，分離成爲音頻流壓縮編碼數據和視頻流壓縮編碼數據。封裝格式種類不少，具體能夠參考下面這張表，它的做用就是將已經壓縮編碼的視頻數據和音頻數據按照必定的格式放到一塊兒。例如，FLV 格式的數據，通過解封裝操做後，輸出 H.264 編碼的視頻碼流和 AAC 編碼的音頻碼流。算法

名稱	推出機構	支持的視頻編碼	支持的音頻編碼
AVI	Microsoft Inc.	幾乎全部格式	幾乎全部格式
MP4	MPEG	MPEG-2, MPEG-4, H.264, H.263等	AAC, MPEG-1 Layers I, II, III, AC-3等
TS	MPEG	MPEG-1, MPEG-2, MPEG-4, H.264	MPEG-1 Layers I, II, III, AAC,
FLV	Adobe Inc.	Sorenson, VP6, H.264	MP3, ADPCM, Linear PCM, AAC等
MKV	CoreCodec Inc.	幾乎全部格式	幾乎全部格式
RMVB	Real Networks Inc.	RealVideo 8, 9, 10	AAC, Cook Codec, RealAudio Lossless

視音頻解碼shell

將視頻/音頻壓縮編碼數據，解碼成爲非壓縮的視頻/音頻原始數據。音頻的壓縮編碼標準包含 AAC，MP3，AC-3 等等，視頻的壓縮編碼標準則包含 H.264，MPEG2，VC-1 等等。解碼是整個系統中最重要也是最複雜的一個環節。經過解碼，壓縮編碼的視頻數據輸出成爲非壓縮的顏色數據，例如 YUV420P，RGB 等等；壓縮編碼的音頻數據輸出成爲非壓縮的音頻抽樣數據，例如 PCM 數據。less

視頻編碼ide

視頻編碼的主要做用是將視頻像素數據（RGB，YUV等）壓縮成爲視頻碼流，從而下降視頻的數據量。若是視頻不通過壓縮編碼的話，體積一般是很是大的，一部電影可能就要上百G的空間。視頻編碼是視音頻技術中最重要的技術之一。視頻碼流的數據量佔了視音頻總數據量的絕大部分。高效率的視頻編碼在同等的碼率下，能夠得到更高的視頻質量。主要的編碼方式有 HEVC(H.265)，H.264，MPEG4，MPEG2，VP9，VP8，VC-1 等等。學習

音頻編碼ui

音頻編碼的主要做用是將音頻採樣數據（PCM等）壓縮成爲音頻碼流，從而下降音頻的數據量。音頻編碼也是互聯網視音頻技術中一個重要的技術。可是通常狀況下音頻的數據量要遠小於視頻的數據量，於是即便使用稍微落後的音頻編碼標準，而致使音頻數據量有所增長，也不會對視音頻的總數據量產生太大的影響。高效率的音頻編碼在同等的碼率下，能夠得到更高的音質。主要的編碼方式有 AAC，AC-3，MP3，WMA 等等。

FFmpeg

整個音視頻技術學習的核心就在協議和編解碼，其中最複雜重要的部分當屬編解碼了，若是沒有基礎的話，咱們能夠買一些書看一下，實體書或電子書都行。若是真的只給你們一個文件和一個 SurfaceView ，第一步解封裝估計就得難倒一大部分人。所以若是是初學習音視頻技術，仍是建議你們基於一些第三方的開源庫來實現功能，等時機成熟了再去了解底層的源碼和算法。我選的是一個經常使用的同時也是你們比較熟悉的開源庫 FFmpeg。因此後面咱們基於 FFmpeg + NDK 來開發音視頻，等有了必定的經驗咱們再去閱讀源碼學習算法。

準備工做

首先咱們得去編譯 FFmpeg 的 so 庫文件，而編譯 so 庫又涉及到 shell 腳本和 cmake 語法知識，因此咱們又須要一個 linux 環境。我當初在學習這些基礎知識時，買的是半年的雲主機服務，若是你們原本就是用的 linux 系統或 mac 系統，那麼就不必再去購買雲主機了。考慮到 Android 底層自己也是基於 linux 內核，趁着買了雲主機的這個機會，我把 linux 內核的基礎也學習了一遍。因此將來幾個月的文章和視頻，基本都是一些關於 shell 腳本，cmake 語法，linux 內核，音視頻編解碼，音視頻通話，視頻直播 等知識。

視頻地址：pan.baidu.com/s/1J4smfhiP…

視頻密碼：7b83