聲音數字化及調音基本原理-學習資料彙總
理論知識儲備
人體發聲原理
人體發聲器官
發聲原理
- 簡而言之,人體經過吸氣增長肺氣壓,呼氣時肺氣壓上升衝擊聲帶,形成聲門的閉合,成爲素音,而素音通過了共鳴腔體,最終發出聲音
音色的構成
- 人的聲音由基音和泛音構成,基因決定音調的高低,泛音則決定了人的音色
語言的造成
- 語言的造成,主要取決於口腔共鳴區(包括口腔、口咽腔和喉腔)各個器官的協做(舌頭位置與形狀、上下顎的空間大小、喉頭的升降、兩脣的形狀和長短),選擇合適的共鳴頻率,這個過程叫作「語言的格式化」,而不一樣的語言的頻段也會有所區別:
<參考文檔> 發聲器官及發聲原理 語言的聲音頻譜 如何訓練腔體共鳴 開口音和閉口音 聲音的三要素跟聲波的幅度、頻率和頻譜的對應關係 圖解泛音及造成原理 聲頻率範圍及各頻段音色效果html
聲音的物理及數學模型
聲波的組成
- 如上圖所示,聲音能夠量化成許多振幅和相位各異的正弦波,
頻域與時域
- 頻域上的各個正弦波,經過傅立葉變換,在時域上投影成一個二維的週期性非正弦波,也就是音頻數字化採樣的模擬波形
混響原理
- 聲源產生的聲波會向四面八方傳播,聲波遇到障礙物會反射,致使接收方會收到不一樣延遲的聲波,這些不一樣延時的聲波混合叫作「混響」
- 在特定的延遲範圍以內,混響能夠造成有立體感的聲音,但大於延遲閥值,則可能致使聲音模糊不清
<參考文檔> 深刻淺出講解傅立葉變換 基波和諧波 混響音效原理和解析android
音頻數字化
- 數字化的主要步驟:採樣->量化->編碼
- 對模擬音源的聲波進行抽樣,一般選取的採樣率是人耳聽覺頻率上限(20kHz)的2倍,44.1kHz,採樣率越大,聲音質量越高,數據量也越大
- 對採樣數據進行量化,選取合適的採樣單位(以比特爲單位,又稱比特率),決定了聲音響度變化的精確度
- 對量化後的數據進行編碼,轉換數字信號
<參考文檔> 視頻公開課:聲音與數字技術算法
調音原理
環境降噪(//TODO)
EQ均衡器調音
- 數字化的聲波是時域上的二維波,經過傅立葉分解以後,能夠獲得基波和諧波,基波決定了音調,而諧波則決定了音色,EQ經過調整不一樣頻段的諧波的振幅(增益或衰減),達到調節音色的效果
EQ均衡器原理api
調音操做實踐
pc端專業調音軟件
- logic pro x2均衡器調音
錄製一段音頻,經過手動調節20~20kHz頻段範圍的分貝值,能夠很大程度地改變總體的音色,好比:對中低頻進行增益,能夠有效突出人聲
手機端音樂播放器
- 網易雲音樂-雲鯨音效
- QQ音樂-super sound
除了經過eq調節音效,同時還能夠經過混響營造不一樣的聲場(譬如:客廳,歌劇院,演唱會)ide
技術方案調研
android系統解決方案
- 系統api支持回聲消除,自動加強,噪音壓制,重低音調節,均衡器控制以及內置的均衡器模版,但選取的幾部測試機只支持均衡器調節,而且調節的幅度範圍偏小,音效的變化不明顯
自定義算法實現(//TODO)