音頻編碼(轉載)

頻率
  不一樣頻率的正弦波,下部分比上部分頻率高頻率是單位時間內某事件重複發生次數的度量,在物理學中一般以符號羅馬字f 或希臘字ν表示,其國際單位爲赫茲(Hz)。設 t 時間內某事件重複發生 n 次,則此事件發生的頻率爲 f = n/t赫茲。又由於週期定義爲重複事件發生的最小間隔,故頻率也能夠週期的倒數表示,即 f = 1/T ,其中 T 表示週期。 
60X=n=> x= n/60
在國際標準單位裏,頻率的單位——赫茲,是以海因裏希?魯道夫?赫茲的名字命名。1 赫茲表示事件每一秒發生一次。 
 每秒一個振動週期稱爲1HZ,人耳可聽到的音頻約爲20HZ到20KHZ。 每秒20~20000振動週期。

音頻 - 聲音信息數字化 
音頻數字化就是將模擬的聲音波形數字化,以便計算機處理,包括採樣、量化、編碼三個步驟。 
(1)採樣 
以固定的時間間隔(採樣週期)抽取模擬信號的幅度值。採樣後獲得的是離散的聲音振幅樣本序列,還是模擬量。採樣頻率越高,聲音的保真度越好,但採樣得到的數據量也越大。在MPC中,採樣頻率標準定爲:11,025KHz,22,05KHz,44,1KHz。 
(2)量化 
把採樣獲得的信號幅度的樣本值從模擬量轉換成數字量。數字量的二進制位數是量化精度。在MPC中,量化精度標準定爲8位,16位。 
採樣和量化過程稱爲模/數(A/D)轉換。 
(3)編碼 
把數字化聲音信息按必定數據格式表示,它的實現方法是靠各類不一樣的壓縮方法將數據編碼壓縮。[1]
音頻 - 影響因素 
(1)採樣頻率:採樣頻率是指單位時間內的採樣次數。採樣頻率越大,採樣點之間的間隔就越小,數字化後獲得的聲音就越逼真,但相應的數據量就越大。聲音採樣頻率以KHz(千赫茲)衡量。 
(2)量化位數(採樣位數):量化位數是模擬量轉換成數字量以後的數據位數。量化位數表示的是聲音的振幅,位數越多,音質越細膩,相應的數據量就越大。量化位數主要有8位和16位兩種。 
(3)聲道數:聲道數是指處理的聲音是單聲道仍是立體聲。單聲道在聲音處理過程當中只有單數據流,而立體聲則須要左、右聲道的兩個數據流。顯然,立體聲的效果要好,但相應的數據量要比單聲道的數據量加倍。 
聲音數據量通常都被稱爲海量數據。這是由於對音質要求越高,數據量就越大。[

解讀音頻屬性
採樣精度
 什麼是採樣精度?由於wav使用的是數碼信號,它是用一堆數字來描述原來的模擬信號,因此它要對原來的模擬信號進行分析,咱們知道全部的聲音都有其波形,數碼信號就是在原有的模擬信號波形上每隔一段時間進行一次「取點」,賦予每個點以一個數值,這就是「採樣」,而後把全部的「點」連起來就能夠描述模擬信號了,很明顯,在必定時間內取的點越多,描述出來的波形就越精確,這個尺度咱們就稱爲「採樣精度」。咱們最經常使用的採樣精度是44.1kHz,它的意思是每秒取樣44100次。之因此使用這個數值是由於通過了反覆實驗,人們發現這個採樣精度最合適,低於這個值就會有較明顯的損失,而高於這個值人的耳朵已經很難分辨,並且增大了數字音頻所佔用的空間。通常爲了達到「萬分精確」,咱們還會使用48kHz甚至96kHz的採樣精度,實際上,96kHz採樣精度和44.1kHz採樣精度的區別絕對不會象44.1kHz和22kHz那樣區別如此之大,咱們所使用的CD的採樣標準就是44.1kHz,目前44.1kHz仍是一個最通行的標準,有些人認爲96kHz將是將來錄音界的趨勢。

比特率
比特率是你們常據說的一個名詞,數碼錄音通常使用16比特、20比特或24比特製做音樂。什麼是「比特」?咱們知道聲音有輕有響,影響聲音響度的物理要素是振幅,做爲數碼錄音,必須也要能精確表示樂曲的輕響,因此必定要對波形的振幅有一個精確的描述。「比特(bit)」就是這樣一個單位,16比特就是指把波形的振幅劃爲2^16即65536個等級,根據模擬信號的輕響把它劃分到某個等級中去,就能夠用數字來表示了。和採樣精度同樣,比特率越高,越能細緻地反映樂曲的輕響變化。20比特就能夠產生1048576個等級,表現交響樂這類動態十分大的音樂已經沒有什麼問題了。剛纔提到了一個名詞「動態」,它其實指的是一首樂曲最響和最輕的對比能達到多少,咱們也常說「動態範圍」,單位是dB,而動態範圍和咱們錄音時採用的比特率是緊密結合在一塊兒的,若是咱們使用了一個很低的比特率,那麼就只有不多的等級能夠用來描述音響的強弱,固然就不能聽到大幅度的強弱對比了。動態範圍和比特率的關係是;比特率每增長1比特,動態範圍就增長6dB。因此假如咱們使用1比特錄音,那麼咱們的動態範圍就只有6dB,這樣的音樂是不可能聽的。16比特時,動態範圍是96dB。這能夠知足通常的需求了。20比特時,動態範圍是120dB,對比再強烈的交響樂均可以應付自如了,表現音樂的強弱是綽綽有餘了。發燒級的錄音師還使用24比特,可是和採樣精度同樣,它不會比20比特有很明顯的變化,理論上24比特能夠作到144 dB的動態範圍,但其實是很難達到的,由於任何設備都不可避免會產生噪音,至少在現階段24比特很難達到其預期效果。
音頻文件格式的特色。   要在計算機內播放或是處理音頻文件,也就是要對聲音文件進行數、模轉換,這個過程一樣由採樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,所以音頻的最大帶寬是20KHZ,故而採樣速率須要介於40~50KHZ之間,並且對每一個樣本須要更多的量化比特數。音頻數字化的標準是每一個樣本16位(16bit,即96dB)的信噪比,採用線性脈衝編碼調製PCM,每一量化步長都具備相等的長度。在音頻文件的製做中,正是採用這一標準。

                                         |
                                                                        |
                                                                        |
                        --------------------------------------------------------------------------採樣
                                                                        |
                                                                        |比特率
音頻編碼
天然界中的聲音很是複雜,波形極其複雜,一般咱們採用的是脈衝代碼調製編碼,即PCM編碼。PCM經過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換爲數字編碼。
有損和無損
  根據採樣率和採樣大小能夠得知,相對天然界的信號,音頻編碼最多隻能作到無限接近,至少目前的技術只能這樣了,相對天然界的信號,任何數字音頻編碼方案都是有損的,由於沒法徹底還原。在計算機應用中,可以達到最高保真水平的就是PCM編碼,被普遍用於素材保存及音樂欣賞,CD、DVD以及咱們常見的WAV文件中均有應用。所以,PCM約定俗成了無損編碼,由於PCM表明了數字音頻中最佳的保真水準,並不意味着PCM就可以確保信號絕對保真,PCM也只能作到最大程度的無限接近。咱們而習慣性的把MP3列入有損音頻編碼範疇,是相對PCM編碼的。強調編碼的相對性的有損和無損,是爲了告訴你們,要作到真正的無損是困難的,就像用數字去表達圓周率,無論精度多高,也只是無限接近,而不是真正等於圓周率的值。
爲何要使用音頻壓縮技術
  要算一個PCM音頻流的碼率是一件很輕鬆的事情,採樣率值×採樣大小值×聲道數 bps。一個採樣率爲44.1KHz,採樣大小爲16bit,雙聲道的PCM編碼的WAV文件,它的數據速率則爲 44.1K×16×2 =1411.2 Kbps。咱們常說128K的MP3,對應的WAV的參數,就是這個1411.2 Kbps,這個參數也被稱爲數據帶寬,它和ADSL中的帶寬是一個概念。將碼率除以8,就能夠獲得這個WAV的數據速率,即176.4KB/s。這表示存儲一秒鐘採樣率爲44.1KHz,採樣大小爲16bit,雙聲道的PCM編碼的音頻信號,須要176.4KB的空間,1分鐘則約爲10.34M,這對大部分用戶是不可接受的,尤爲是喜歡在電腦上聽音樂的朋友,要下降磁盤佔用,只有2種方法,下降採樣指標或者壓縮。下降指標是不可取的,所以專家們研發了各類壓縮方案。因爲用途和針對的目標市場不同,各類音頻壓縮編碼所達到的音質和壓縮比都不同,在後面的文章中咱們都會一一提到。有一點是能夠確定的,他們都壓縮過。

頻率與採樣率的關係
  採樣率表示了每秒對原始信號採樣的次數,咱們常見到的音頻文件採樣率多爲44.1KHz,這意味着什麼呢?假設咱們有2段正弦波信號,分別爲20Hz和20KHz,長度均爲一秒鐘,以對應咱們能聽到的最低頻和最高頻,分別對這兩段信號進行40KHz的採樣,咱們能夠獲得一個什麼樣的結果呢?結果是:20Hz的信號每次振動被採樣了40K/20=2000次,而20KHz的信號每次振動只有2次採樣。顯然,在相同的採樣率下,記錄低頻的信息遠比高頻的詳細。
PCM編碼
  PCM 脈衝編碼調製是Pulse Code Modulation的縮寫。前面的文字咱們提到了PCM大體的工做流程,咱們不須要關心PCM最終編碼採用的是什麼計算方式,咱們只須要知道PCM編碼的音頻流的優勢和缺點就能夠了。PCM編碼的最大的優勢就是音質好,最大的缺點就是體積大。咱們常見的Audio CD就採用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。

WAV
咱們接觸到比較多的DivX就是一種視頻編碼,AVI能夠採用DivX編碼來壓縮視頻流,固然也可使用其餘的編碼壓縮。一樣,WAV也可使用多種音頻編碼來壓縮其音頻流,不過咱們常見的都是音頻流被PCM編碼處理的WAV,但這不表示WAV只能使用PCM編碼,MP3編碼一樣也能夠運用在WAV中,和AVI同樣,只要安裝好了相應的Decode,就能夠欣賞這些WAV了。 
MP3編碼
MP3簡介
  MP3做爲目前最爲普及的音頻壓縮格式,爲你們所大量接受,編碼

 

編碼:用代碼表示信息的過程。
解碼:將信息從已經編碼的形式恢復到編碼前原狀的過程。
數字模式下,音頻的初始信號是PCM(例如wav),可是PCM體積龐大,不利於傳輸,因而通過編碼使其體積變下,例如wav編碼成mp3。
解碼,就是編碼的逆過程,例如播放mp3時,是先將mp3解碼成pcm,而後播放。
音頻格式也分無損和有損,mp3就是有損的音頻編碼,mp3還原成pcm時,與以前的是pcm有差異!感受上就是音質降低!code

 

 

音頻編碼視頻

相關文章
相關標籤/搜索