【秒懂音視頻開發】07_重識音頻

時間 2021-03-10

標籤 git 編碼 blog get 音頻原理互聯網欄目 Git 简体版

原文原文鏈接

咱們平時在互聯網上聽到的聲音，都是先通過錄制後，再傳輸到互聯網上的。好比歌曲、電影、某某主播等的聲音。git

PCM編碼

錄音的原理能夠簡單理解爲：把聲源的振動記錄下來，須要時再讓某個物體按照記錄下來的振動規律去振動，就會產生與原來同樣的聲音。編碼

如何把聲音（聲源的振動）記錄下來呢？聲音屬於模擬信號，但更便於計算機處理和存儲的是數字信號（二進制編碼），因此須要將模擬信號（Analog Signal）轉成數字信號（Digital Signal）後進行存儲。這一過程，咱們能夠稱爲：音頻數字化。blog

將音頻數字化的常見方案是採用脈衝編碼調製（PCM，Pulse Code Modulation），主要過程是：採樣 → 量化 → 編碼。ip

採樣

模擬信號的波形是無限光滑的，能夠當作由無數個點組成，因爲存儲空間是相對有限的，數字編碼過程當中，必需要對波形的點進行採樣。採樣（Sampling）：每隔一段時間採集一次模擬信號的樣本，是一個在時間上將模擬信號離散化（把連續信號轉換成離散信號）的過程。get

採樣率

每秒採集的樣本數量，稱爲採樣率（採樣頻率，Sampling Rate）。好比，採樣率44.1kHz 表示1秒鐘採集44100個樣本。通常採樣率越高，數字化音頻的質量越好。it

採樣定理

根據採樣定理，只有當採樣率高於聲音信號最高頻率的2倍時，才能把採集的聲音信號惟一地還原成原來的聲音。人耳可以感受到的最高聲音頻率爲20kHz，所以要知足人耳的聽覺要求，則須要至少每秒進行40k次採樣（40kHz採樣率）。常見的CD，採樣率爲44.1kHz。io

量化

量化（Quantization）：將每個採樣點的樣本值數字化。音頻

採樣精度

採樣精度（採樣大小，量化位數）：使用多少個二進制位來存儲樣點的樣本值。常見的CD採用16bit的採樣精度，能表示65536（2¹⁶）個不一樣的值。原理

編碼

編碼：將採樣和量化後的數字數據轉成二進制碼流。互聯網

有損和無損

根據採樣率和採樣精度能夠得知：相對於天然界的信號，音頻編碼最多隻能作到無限接近，任何數字音頻編碼方案都是有損的，由於沒法徹底還原。目前可以達到最高保真水平的就是PCM編碼，所以，PCM約定俗成了無損編碼，被普遍用於素材保存及音樂欣賞，CD、DVD以及常見的WAV文件中均有應用。

但並不意味着PCM就可以確保信號絕對保真，PCM也只能作到最大程度的無限接近。咱們習慣性的把MP3列入有損音頻編碼範疇，是相對於PCM編碼的。強調編碼的相對性的有損和無損，是爲了告訴你們：要作到真正的無損是困難的，就像用數字去表達圓周率，無論精度多高，也只是無限接近，而不是真正等於圓周率的值。

PCM編碼數據能夠理解爲是未經壓縮的原始音頻數據。

聲道

單聲道產生一組聲波數據，雙聲道（立體聲）產生兩組聲波數據。

採樣率44.1kHZ、採樣精度16bit的1分鐘立體聲PCM編碼數據有多大？

44100 * 16 * 2 * 60 / 8 ≈ 10.34MB

1分鐘10.34MB，這對於大部分用戶來講是不能接受的。要想在不改變音頻時長的前提下，下降音頻數據的大小，只有2種方法：下降採樣指標、壓縮。下降指標是不可取的，所以專家們研發了各類壓縮方案。

比特率

比特率（Bit Rate），指單位時間內傳輸送或處理的比特的數量，單位是比特每秒（bit/s或bps），還有：千（Kbit/s或Kbps）、兆（Mbit/s或Mbps）、吉（Gbit/s或Gbps）、太（Tbit/s或Tbps）。

採樣率44.1kHZ、採樣精度16bit的立體聲PCM編碼數據的比特率是多少？

44100 * 16 * 2 = 1411.2Kbps

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。