咱們平時在互聯網上聽到的聲音,都是先通過錄制後,再傳輸到互聯網上的。好比歌曲、電影、某某主播等的聲音。git
錄音的原理能夠簡單理解爲:把聲源的振動記錄下來,須要時再讓某個物體按照記錄下來的振動規律去振動,就會產生與原來同樣的聲音。編碼
如何把聲音(聲源的振動)記錄下來呢?聲音屬於模擬信號,但更便於計算機處理和存儲的是數字信號(二進制編碼),因此須要將模擬信號(Analog Signal)轉成數字信號(Digital Signal)後進行存儲。這一過程,咱們能夠稱爲:音頻數字化。blog
將音頻數字化的常見方案是採用脈衝編碼調製(PCM,Pulse Code Modulation),主要過程是:採樣 → 量化 → 編碼。ip
模擬信號的波形是無限光滑的,能夠當作由無數個點組成,因爲存儲空間是相對有限的,數字編碼過程當中,必需要對波形的點進行採樣。採樣(Sampling):每隔一段時間採集一次模擬信號的樣本,是一個在時間上將模擬信號離散化(把連續信號轉換成離散信號)的過程。get
每秒採集的樣本數量,稱爲採樣率(採樣頻率,Sampling Rate)。好比,採樣率44.1kHz 表示1秒鐘採集44100個樣本。通常採樣率越高,數字化音頻的質量越好。it
根據採樣定理,只有當採樣率高於聲音信號最高頻率的2倍時,才能把採集的聲音信號惟一地還原成原來的聲音。人耳可以感受到的最高聲音頻率爲20kHz,所以要知足人耳的聽覺要求,則須要至少每秒進行40k次採樣(40kHz採樣率)。常見的CD,採樣率爲44.1kHz。io
量化(Quantization):將每個採樣點的樣本值數字化。音頻
採樣精度(採樣大小,量化位數):使用多少個二進制位來存儲樣點的樣本值。常見的CD採用16bit的採樣精度,能表示65536(216)個不一樣的值。原理
編碼:將採樣和量化後的數字數據轉成二進制碼流。互聯網
根據採樣率和採樣精度能夠得知:相對於天然界的信號,音頻編碼最多隻能作到無限接近,任何數字音頻編碼方案都是有損的,由於沒法徹底還原。目前可以達到最高保真水平的就是PCM編碼,所以,PCM約定俗成了無損編碼,被普遍用於素材保存及音樂欣賞,CD、DVD以及常見的WAV文件中均有應用。
但並不意味着PCM就可以確保信號絕對保真,PCM也只能作到最大程度的無限接近。咱們習慣性的把MP3列入有損音頻編碼範疇,是相對於PCM編碼的。強調編碼的相對性的有損和無損,是爲了告訴你們:要作到真正的無損是困難的,就像用數字去表達圓周率,無論精度多高,也只是無限接近,而不是真正等於圓周率的值。
PCM編碼數據能夠理解爲是未經壓縮的原始音頻數據。
單聲道產生一組聲波數據,雙聲道(立體聲)產生兩組聲波數據。
採樣率44.1kHZ、採樣精度16bit的1分鐘立體聲PCM編碼數據有多大?
1分鐘10.34MB,這對於大部分用戶來講是不能接受的。要想在不改變音頻時長的前提下,下降音頻數據的大小,只有2種方法:下降採樣指標、壓縮。下降指標是不可取的,所以專家們研發了各類壓縮方案。
比特率(Bit Rate),指單位時間內傳輸送或處理的比特的數量,單位是比特每秒(bit/s或bps),還有:千(Kbit/s或Kbps)、兆(Mbit/s或Mbps)、吉(Gbit/s或Gbps)、太(Tbit/s或Tbps)。
採樣率44.1kHZ、採樣精度16bit的立體聲PCM編碼數據的比特率是多少?