【秒懂音視頻開發】07_重識音頻

咱們平時在互聯網上聽到的聲音,都是先通過錄制後,再傳輸到互聯網上的。好比歌曲、電影、某某主播等的聲音。git

PCM編碼

錄音的原理能夠簡單理解爲:把聲源的振動記錄下來,須要時再讓某個物體按照記錄下來的振動規律去振動,就會產生與原來同樣的聲音。編碼

記錄

重現

如何把聲音(聲源的振動)記錄下來呢?聲音屬於模擬信號,但更便於計算機處理和存儲的是數字信號(二進制編碼),因此須要將模擬信號(Analog Signal)轉成數字信號(Digital Signal)後進行存儲。這一過程,咱們能夠稱爲:音頻數字化。blog

模擬信號與數字信號比喻

模數轉換

將音頻數字化的常見方案是採用脈衝編碼調製PCM,Pulse Code Modulation),主要過程是:採樣 → 量化 → 編碼。ip

模擬信號轉數字信號

模擬信號轉數字信號

採樣

模擬信號的波形是無限光滑的,能夠當作由無數個點組成,因爲存儲空間是相對有限的,數字編碼過程當中,必需要對波形的點進行採樣。採樣(Sampling):每隔一段時間採集一次模擬信號的樣本,是一個在時間上將模擬信號離散化(把連續信號轉換成離散信號)的過程。get

採樣率

每秒採集的樣本數量,稱爲採樣率(採樣頻率,Sampling Rate)。好比,採樣率44.1kHz 表示1秒鐘採集44100個樣本。通常採樣率越高,數字化音頻的質量越好。it

採樣定理

根據採樣定理,只有當採樣率高於聲音信號最高頻率的2倍時,才能把採集的聲音信號惟一地還原成原來的聲音。人耳可以感受到的最高聲音頻率爲20kHz,所以要知足人耳的聽覺要求,則須要至少每秒進行40k次採樣(40kHz採樣率)。常見的CD,採樣率爲44.1kHz。io

量化

量化(Quantization):將每個採樣點的樣本值數字化。音頻

採樣精度

採樣精度(採樣大小,量化位數):使用多少個二進制位來存儲樣點的樣本值。常見的CD採用16bit的採樣精度,能表示65536(216)個不一樣的值。原理

不一樣採樣率、採樣精度對比

編碼

編碼:將採樣和量化後的數字數據轉成二進制碼流。互聯網

有損和無損

根據採樣率和採樣精度能夠得知:相對於天然界的信號,音頻編碼最多隻能作到無限接近,任何數字音頻編碼方案都是有損的,由於沒法徹底還原。目前可以達到最高保真水平的就是PCM編碼,所以,PCM約定俗成了無損編碼,被普遍用於素材保存及音樂欣賞,CD、DVD以及常見的WAV文件中均有應用。

但並不意味着PCM就可以確保信號絕對保真,PCM也只能作到最大程度的無限接近。咱們習慣性的把MP3列入有損音頻編碼範疇,是相對於PCM編碼的。強調編碼的相對性的有損和無損,是爲了告訴你們:要作到真正的無損是困難的,就像用數字去表達圓周率,無論精度多高,也只是無限接近,而不是真正等於圓周率的值。

PCM編碼數據能夠理解爲是未經壓縮的原始音頻數據。

聲道

單聲道產生一組聲波數據,雙聲道(立體聲)產生兩組聲波數據。

採樣率44.1kHZ、採樣精度16bit的1分鐘立體聲PCM編碼數據有多大?

  • 44100 * 16 * 2 * 60 / 8 ≈ 10.34MB

1分鐘10.34MB,這對於大部分用戶來講是不能接受的。要想在不改變音頻時長的前提下,下降音頻數據的大小,只有2種方法:下降採樣指標、壓縮。下降指標是不可取的,所以專家們研發了各類壓縮方案。

比特率

比特率(Bit Rate),指單位時間內傳輸送或處理的比特的數量,單位是比特每秒(bit/s或bps),還有:千(Kbit/s或Kbps)、兆(Mbit/s或Mbps)、吉(Gbit/s或Gbps)、太(Tbit/s或Tbps)。

採樣率44.1kHZ、採樣精度16bit的立體聲PCM編碼數據的比特率是多少?

  • 44100 * 16 * 2 = 1411.2Kbps
相關文章
相關標籤/搜索