寫給小白的音頻認識基礎

初識音頻

從初中物理上咱們就學到,聲音是一種波。計算機只能處理離散的信號,經過收集足夠多的離散的信號,來不斷逼近波形,這個過程咱們叫作採樣。怎麼樣才能更好的還原聲音信息呢?這裏很天然引出兩個概念了。算法

聲音波形圖

採樣頻率(Sample Rate):每秒採集聲音的數量,它用赫茲(Hz)來表示。bash

採樣率越高越靠近原聲音的波形,常見的採樣率有如下幾種:app

  • 8khz:電話等使用,對於記錄人聲已經足夠使用。
  • 22.05khz:廣播使用頻率。
  • 44.1kb:音頻CD。
  • 48khz:DVD、數字電視中使用。
  • 96khz-192khz:DVD-Audio、藍光高清等使用。

採樣精度(Bit Depth): 它表示每次採樣的精度,位數越多,能記錄的範圍就越大。工具

採樣精度經常使用範圍爲8bit-32bit,而CD中通常都使用16bit。學習

把聲音記錄下來以後,經過喇叭的震動把波再還給空氣傳到你的耳朵就完成了這個完美的循環了。可是富有創造力的人類不會限制於此就結束了,很快人們發現,當把不一樣的聲音傳遞到不一樣的喇叭的時候,居然會驚奇地讓聲音變得有空間感了,即時是同一個聲音,也比單個通道能得到更好的體驗,因而就出現了什麼立體聲,5.1 環繞等看起來很高大上的東西。因此,音頻又多了一個東西:網站

聲音通道(Channel): 你知道每一個通道存儲的聲音會從其中的一個喇叭出來就行了,不過能夠經過算法的模擬來讓沒有那麼多喇叭也能出來相似的效果。ui

有了聲音通道,樂隊在錄音的時候就能夠每一個人插一條音軌了,而後每個聲音能夠寫到不一樣的通道里面,固然,實際錄音固然都是後期混音而成的。下面介紹的其中一個混音算法會用到聲音通道這個特性。編碼

最後再介紹一個你們常常看到的概念:spa

比特率(bps [bits per second]): 其實看單位就很容易知道它要表達的意思了,就是每秒鐘要播放多少 bit 的數據。公式一目瞭然:3d

比特率 = 採樣率 × 採樣深度 × 通道。
複製代碼

好比 採樣率 = 44100,採樣深度 = 16,通道 = 2 的音頻的的比特率就是 44100 * 16 * 2 = 1411200 bps。

通常來講,比特率越高,音頻質量越好。要注意一些比特率的換算不是 1024 做爲一個級別換算的哈。

1,000 bps	= 【1 kbps】 =	1,000 bit/s
1,000,000 bps	= 【1 Mbps】 =	1,000,000 bit/s	
1,000,000,000 bps	= 【1 Gbps】 =	1,000,000,000 bit/s
複製代碼

音頻在計算機中的表示

咱們來看一下真實音頻在計算機中到底是怎樣的表示狀態,這裏指的是原始的數據表示,而非編碼(Mp3,Acc等)後的表示,平時咱們看到的.wav後綴的音頻,把前面 44 個字節用於記錄採樣率、通道等的頭部信息去掉後就是就是原始的音頻數據了。

WAV表示圖

在理解了上面的概念以後,咱們再來看這張圖。對於文件頭部信息咱們就不詳細介紹了,不影響咱們理解介紹的混音處理方式,須要瞭解的能夠點擊這裏

咱們抽取其中的一個採樣來看,這裏我加多了一個通道,便於你們理解通道的存儲位置。

音頻採樣圖

不難理解,這個採樣中有三個通道,每通道採樣精度是 16 比特。每一個採樣值的排序是 Little-Endian 低位在前的方式,好比通道 1 的採樣值就是 AB03, 每一個採樣值的大小表示的是幅度信息。

好了,先介紹到這裏,但願對你有幫助,若是文章有理解錯誤的地方,請給我留言指出,感謝你的閱讀,下一篇將會介紹有關音頻混音的相關知識。

參考資料

  1. WAV文件格式
  2. 維基百科-比特率

技術交流羣:70948803,大部分時間羣裏都是安靜的,只交流技術相關,不多發言,不歡迎廣告噴子。

不玩音樂的看到這裏能夠關閉了。

色彩濃重的廣告時間:

若是你有玩音樂,我作了一個音樂學習和記錄的輔助工具。剛在 Google Play 發佈,能夠直接點擊這裏下載:下載聲音筆記+。我平時會用它來做即興練習和合奏練習。

如下是免費的:

相關文章
相關標籤/搜索