1 引言html
1.1 MIMO聲信號處理算法
一方面,咱們面臨着更加複雜的聲環境。麥克風接收到的信號,目標語音混雜着如下四種干擾:框架
1 噪聲。函數
2 回聲。回聲的產生是因爲揚聲器和麥克風的耦合。回聲的存在會使得交互變得更加困難。性能
3 混響。混響是多路徑傳播和封閉環境下的結果。儘管混響受到封閉環境的大小,加強音樂的飽和度,可是混響影響了頻譜,這使得聲源定位變得困難。測試
4 干擾。設計
2 聲信號系統htm
系統模型的基礎是信號處理和控制理論,以及聲應用。建立聲信號數學表達式有助於咱們更好的理解。數學
2.1 信號模型基礎
對許多聲信號處理和應用,特別是本書的後面,聲系統的輸入輸出個數對算法的選擇是個關鍵因素,涉及到複雜度。所以,聲信號系統須要分類,咱們相信最重要的信號輸入輸出決定數學模型。
2.1.1 單輸入單輸出模型
圖2.1 描述了四種不一樣的聲信號模型
通道響應用的是FIR濾波器而不是IIR濾波器,在以後的文章裏會解釋,這裏只討論聲信號通道特性,SISO的向量形式:
2.2 聲信號通道的特性
儘管研究MIMO聲信號結構系統時間很短,MIMO模型已經普遍應用在無線通訊中幾十年了,可是聲信號不一樣於無線通訊。所以要總結一下聲信號通道的特性。
2.2.1線性時不變
咱們知道並非全部的系統都是線性時不變的。可是幸運的是聲信號通道是時不變(LSI)系統。線性時不變是兩個最重要的屬性用來簡化分析和設計離散時間系統。一個線性系統應該知足一致性和可加性。一個系統時移特性的輸入時移和輸出時移是同樣的。有了這些特性,LSI系統很容易計算響應。
2.2.2 FIR
聲信號通道衝擊響應的長度很長,可是FIR(有限長衝擊響應)濾波器用的比IIR(無限長衝擊響應)多在聲信號處理。首先FIR濾波器的穩定性是很容易控制的經過調整濾波器的係數。第二,目前存在不少自適應FIR算法以及算法的性能,收斂性,跟蹤,穩定性。第三,FIR濾波器能夠精確地模擬聲信號通道,知足標準設計。最後,FIR濾波器能夠硬件實現。
2.2.3 時變通道衝擊響應
通道響應特性與輸入輸出系統的關係,系統須要線性時不變的。可是,不少通訊通道存在物理結構的問題,並且聲信號通道是時變的。聲源的移動和環境的變化,以及室內環境的封閉性問題。即便一個聲信號環境是緊密的封閉環境,可是依然存在高動態不平穩的特性。例如室內房間溫度的變化都會致使氣壓變化,引發聲信號傳輸通道變化。可是時變特性並不能阻止咱們使用FIR濾波器模擬聲傳遞通道,由於聲系統改變很慢在必定長度的通道響應。
2.2.4 頻率選擇
聲波在空氣中的傳輸經過擾動。經過球面輻射和傳播,。1米6db的降低。可是當聲傳播的距離是很長的距離,30米,高頻衰減,暗示着聲傳播通道的是具備頻率的選擇特性的。並且高頻衰減依賴於空氣密度和大氣壓的環境。
聲傳播環境,辦公室,會議室,車,聲波在封閉環境下反射屢次才能達到麥克風。並且不一樣頻率的衰減又不一樣。
2.2.5混響時間
室內混響是對聲音具備破壞性的。可是室內混響並非決定性的,混響有助於聽者。
混響的等級典型的是T60測試混響時間,T60是sabine(http://www.acoustics-engineering.com/html/sabin.html)提供一種測量方法以及如今部分ISO混響測量。T60的混響時間被定義爲原始信號降低到60db的狀況。邏輯上來說,不少混響時間估計算法基於聲音延遲和記錄聲信道響應。若是信號是一個理想的衝擊響應,而後那麼聲延遲曲線是很關鍵的衝擊響應聲模型。所以,咱們將會簡潔的解釋如何估計混響時間,根據得到的聲衝擊響應。
混響能量在聲信號的響應中,如圖2.2(a),是有貝爾實驗室的消聲室測出來的。若是能量測出來時是db,那麼時間延遲線性曲線能夠很清楚的從圖2.2(b)中看出.混響時間是由估計能量比決定的。經過使用Schroeder(https://ccrma.stanford.edu/~jos/pasp/Schroeder_Reverberators.html)方法,一種平滑的更加精確估計時延方法如圖2.2(c),致使錯誤。最後線性擬合用來合成必定的框架。從這個線性擬合的曲線,咱們發現T60的混響時間爲395ms。
2.2.6信道的可逆性和最小相位濾波器
聲通道的可逆性是頗有用的一部分在許多應用中,如語音加強和去混響。一個系統是可逆的,輸入輸出之間的關係很好肯定。換句話說,存在一個穩定的可逆濾波器補償。
最小相位濾波器的特性,最小延遲,最小能量差。
圖2.2 描述的是混響時間的估計
(a)採樣衝擊響應
(b)方差衝擊響應
(c)400ms的平滑,線性擬合曲線
2.2.7 多通道與零點問題
多通道系統最重要的特性是通道分集。分集使得一個多通道系統不一樣於單通道對應關係。在多通道系統中,單通道是多通道的一個特例。嚴格說來,多通道系統主要是應用在無線通訊,通道分集代表不一樣通道的多通道系統沒有共同點。若是通道模型是FIR濾波器,通道的分集意味着他們的傳遞函數沒有共同的零點,或者換句話說,是互素多項式。
一個分集多通道系統是不可約的。可是一個多通道系統的衝擊響應有共同的零點能夠被分解成兩個或者更多的子系統,這樣咱們既沒有單個以及多個多通道通道。例如,一個SIMO的FIR系統,通道傳遞函數是互質的,
那麼多項式能夠寫成
SIMO系統能夠分解成SISO系統,這樣能夠減小SIMO的複雜度,如圖2.3.很明顯這兩個子系統根本不會影響輸入輸出。零點的問題對於SIMO的系統而言是很重要的,由於不可約性對盲的SIMO系統是很重要的,以及(b)的不可約性使得咱們……
對於一個不可約的FIR濾波器的SIMO系統,
圖2.3 一個可約的SIMO的FIR濾波器的系統,通道的衝擊響應的零點是相同的
當這個不可約的特性能夠從SIMO系統拓展到MIMO系統,須要Z變換,獲得H(Z)。