聲音數字化及調音基本原理-學習資料彙總

聲音數字化及調音基本原理-學習資料彙總

理論知識儲備

人體發聲原理

人體發聲器官

undefined

發聲原理

  • 簡而言之,人體經過吸氣增長肺氣壓,呼氣時肺氣壓上升衝擊聲帶,形成聲門的閉合,成爲素音,而素音通過了共鳴腔體,最終發出聲音

音色的構成

  • 人的聲音由基音和泛音構成,基因決定音調的高低,泛音則決定了人的音色

語言的造成

  • 語言的造成,主要取決於口腔共鳴區(包括口腔、口咽腔和喉腔)各個器官的協做(舌頭位置與形狀、上下顎的空間大小、喉頭的升降、兩脣的形狀和長短),選擇合適的共鳴頻率,這個過程叫作「語言的格式化」,而不一樣的語言的頻段也會有所區別:
    undefined

<參考文檔> 發聲器官及發聲原理 語言的聲音頻譜 如何訓練腔體共鳴 開口音和閉口音 聲音的三要素跟聲波的幅度、頻率和頻譜的對應關係 圖解泛音及造成原理 聲頻率範圍及各頻段音色效果html

聲音的物理及數學模型

聲波的組成

undefined

  • 如上圖所示,聲音能夠量化成許多振幅和相位各異的正弦波,

頻域與時域

undefined

  • 頻域上的各個正弦波,經過傅立葉變換,在時域上投影成一個二維的週期性非正弦波,也就是音頻數字化採樣的模擬波形

混響原理

undefined

  • 聲源產生的聲波會向四面八方傳播,聲波遇到障礙物會反射,致使接收方會收到不一樣延遲的聲波,這些不一樣延時的聲波混合叫作「混響」
  • 在特定的延遲範圍以內,混響能夠造成有立體感的聲音,但大於延遲閥值,則可能致使聲音模糊不清

<參考文檔> 深刻淺出講解傅立葉變換 基波和諧波 混響音效原理和解析android

音頻數字化

  • 數字化的主要步驟:採樣->量化->編碼
    undefined
  • 對模擬音源的聲波進行抽樣,一般選取的採樣率是人耳聽覺頻率上限(20kHz)的2倍,44.1kHz,採樣率越大,聲音質量越高,數據量也越大
  • 對採樣數據進行量化,選取合適的採樣單位(以比特爲單位,又稱比特率),決定了聲音響度變化的精確度
    undefined
  • 對量化後的數據進行編碼,轉換數字信號

<參考文檔> 視頻公開課:聲音與數字技術算法

調音原理

環境降噪(//TODO)

EQ均衡器調音

  • 數字化的聲波是時域上的二維波,經過傅立葉分解以後,能夠獲得基波和諧波,基波決定了音調,而諧波則決定了音色,EQ經過調整不一樣頻段的諧波的振幅(增益或衰減),達到調節音色的效果

EQ均衡器原理api

調音操做實踐

pc端專業調音軟件

  • logic pro x2均衡器調音
    undefined
    錄製一段音頻,經過手動調節20~20kHz頻段範圍的分貝值,能夠很大程度地改變總體的音色,好比:對中低頻進行增益,能夠有效突出人聲

手機端音樂播放器

  • 網易雲音樂-雲鯨音效
    net_cloud_music_effect.jpg
  • QQ音樂-super sound
    qq_music_effect.jpg

除了經過eq調節音效,同時還能夠經過混響營造不一樣的聲場(譬如:客廳,歌劇院,演唱會)ide

技術方案調研

android系統解決方案

device-2018-11-08-174441.png

  • 系統api支持回聲消除,自動加強,噪音壓制,重低音調節,均衡器控制以及內置的均衡器模版,但選取的幾部測試機只支持均衡器調節,而且調節的幅度範圍偏小,音效的變化不明顯

自定義算法實現(//TODO)

相關文章
相關標籤/搜索