版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
南京郵電大學(xué)
通信與信息工程學(xué)院
第12章聲源定位雙耳聽(tīng)覺(jué)定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.1雙耳聽(tīng)覺(jué)定位原理及方法—人耳聽(tīng)覺(jué)定位原理原理:主要是依靠頭部結(jié)構(gòu)所引起的“雙耳效應(yīng)”和耳朵結(jié)構(gòu)的“耳郭效應(yīng)”及復(fù)雜的神經(jīng)系統(tǒng)實(shí)現(xiàn)人耳對(duì)于聲音信號(hào)的方位判斷。構(gòu)造:由外耳、中耳和內(nèi)耳組成。外耳包括耳翼和外耳道,負(fù)責(zé)在中頻段產(chǎn)生共鳴;中耳由鼓膜和聽(tīng)小骨組成,起到阻抗變換器的作用,將聲波從低阻抗的空氣傳遞到高阻抗的淋巴液;內(nèi)耳包括耳蝸,是聽(tīng)覺(jué)系統(tǒng)的核心部分,其中基底膜上的毛狀神經(jīng)末梢負(fù)責(zé)將聲音振動(dòng)轉(zhuǎn)化為神經(jīng)信號(hào)。特性:(1)耳蝸分頻特性:耳蝸能夠?qū)⒉煌l率的聲音在基底膜上進(jìn)行分頻處理,類似于頻譜分析儀,將聲音劃分為多個(gè)臨界頻帶。(2)人耳聽(tīng)覺(jué)掩蔽效應(yīng):當(dāng)兩個(gè)聲音同時(shí)存在時(shí),一個(gè)聲音可能會(huì)因?yàn)榱硪粋€(gè)聲音的干擾而變得難以聽(tīng)見(jiàn)。掩蔽效應(yīng)分為頻域掩蔽和時(shí)域掩蔽。12.1雙耳聽(tīng)覺(jué)定位原理及方法—人耳聲源定位線索(1)雙耳定位線索:人類利用雙耳感知聲音的強(qiáng)度、音調(diào)和音色,并判斷聲源的距離和方向;聲源定位主要依賴于聲音到達(dá)雙耳的時(shí)間差(ITD)、強(qiáng)度差(ILD)、雙耳相位差和雙耳音色差;在低中頻(f<1.5kHz)情況下,雙耳時(shí)間差是主要因素;在1.5~4.0kHz范圍內(nèi),聲級(jí)差和時(shí)間差共同作用;高頻(f>5.0kHz)時(shí),雙耳聲級(jí)差成為主要因素。(2)“耳郭效應(yīng)”定位線索:耳郭的形狀和結(jié)構(gòu)對(duì)聲音的頻譜特性產(chǎn)生影響,類似于梳狀濾波器;不同方向的聲音在耳郭上產(chǎn)生不同的反射和直達(dá)聲,導(dǎo)致在鼓膜處形成與聲源方向有關(guān)的頻譜特性;耳郭效應(yīng)主要影響高頻聲音,因?yàn)楦哳l波長(zhǎng)短,容易產(chǎn)生干涉現(xiàn)象。12.1雙耳聽(tīng)覺(jué)定位原理及方法—人耳聲源定位線索(3)頭相關(guān)傳輸函數(shù):HRTF描述了聲波從聲源到雙耳的傳輸過(guò)程,包括ITD、ILD和頻譜結(jié)構(gòu)特性;HRTF是個(gè)體差異的,因?yàn)槊總€(gè)人的頭部和耳郭形狀不同;HRTF可以通過(guò)測(cè)量或計(jì)算得到,其中麻省理工學(xué)院的CIPIC數(shù)據(jù)庫(kù)提供了適合中國(guó)人生理構(gòu)造的HRTF數(shù)據(jù)。12.1雙耳聽(tīng)覺(jué)定位原理及方法—聲源估計(jì)方法聲源定位指標(biāo):水平方位角不同頻率下的定位作用:在中低頻(小于1.5kHz,最佳信號(hào)頻率為270~500Hz)時(shí),ITD起主要作用;在中頻(1.6~4kHz)時(shí),ITD和ILD共同作用;在中高頻(4~5kHz)時(shí),ILD起主要作用;在高頻(5~6kHz以上)時(shí),耳郭對(duì)聲波的散射起到梳狀濾波的作用,對(duì)定位垂面上的聲源方位有重要作用。水平極坐標(biāo)模型:描述了聲音信號(hào)到達(dá)頭部坐標(biāo)的示意圖,其中線路方向、左右耳傳感器和中心坐標(biāo)點(diǎn)在同一平面。聲源到左右耳的距離差(Δd):參數(shù)化ITD模型:
模型反轉(zhuǎn):當(dāng)方位評(píng)估時(shí)信號(hào)的頻率與建模時(shí)不一致,可以使用參數(shù)模型反轉(zhuǎn)來(lái)得到水平角度θ,即雙耳聽(tīng)覺(jué)定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.2傳聲器陣列模型—概述傳聲器陣列定義:傳聲器陣列是由多個(gè)傳聲器按照一定空間結(jié)構(gòu)排列組成的,其中各個(gè)陣元的間距和具體位置對(duì)聲源定位起著決定性作用。傳聲器陣列的觀察空間由其拓?fù)浣Y(jié)構(gòu)決定,導(dǎo)向向量攜帶聲源位置的參數(shù)信息。傳聲器陣列模型:根據(jù)聲源與傳聲器陣列的距離,傳聲器陣列模型可分為近場(chǎng)和遠(yuǎn)場(chǎng),判斷公式為
。傳聲器陣列處理的信號(hào)考慮了近場(chǎng)和遠(yuǎn)場(chǎng)模型下不同的拓?fù)浣Y(jié)構(gòu),這些結(jié)構(gòu)影響空間導(dǎo)向向量和攜帶的信息。近場(chǎng)模型攜帶距離、時(shí)延和聲源空間位置信息,而遠(yuǎn)場(chǎng)模型僅攜帶聲源空間位置信息。此外,陣元間距也直接影響著聲源定位的結(jié)果,而陣元個(gè)數(shù)可以適當(dāng)?shù)靥岣叨ㄎ痪?。由此可?jiàn),傳聲器的拓?fù)浣Y(jié)構(gòu)對(duì)后續(xù)聲源定位起著至關(guān)重要的作用。12.2傳聲器陣列模型—均勻線陣定義:均勻線陣是一種簡(jiǎn)單的陣列形式,由M個(gè)陣元等距離排列成一直線,陣元間距為d。時(shí)延和方向向量:以第一個(gè)陣元為參考,各陣元相對(duì)參考陣元的時(shí)延由公式
給出。方向向量由陣元的時(shí)延決定,并且與空間角θ有關(guān),如下
陣列流形矩陣:若有D個(gè)信號(hào)源,其波達(dá)方向分別為θi(i=1,2,...,D),則陣列流形矩陣為
12.2傳聲器陣列模型—均勻線陣方向向量的唯一性:陣列結(jié)構(gòu)要求方向向量a(θ)與空間角θ一一對(duì)應(yīng),以避免模糊現(xiàn)象。陣元間距的選擇:陣元間距d不能任意選定,需要精確校準(zhǔn)。為了避免相位模糊,陣元間距應(yīng)不大于半波長(zhǎng)
,以保證陣列流形矩陣的列向量線性獨(dú)立。傳聲器陣列的輸出:12.2傳聲器陣列模型—均勻圓陣定義:均勻圓陣是一種平面陣列,能夠同時(shí)確定信號(hào)的方位角和仰角,由M個(gè)相同的各向同性陣元均勻分布在x-y平面的一個(gè)半徑為R的圓周上。采用球面坐標(biāo)系表示入射平面波的波達(dá)方向,坐標(biāo)系原點(diǎn)O位于陣列中心,即圓心。信源俯角θ是原點(diǎn)到信源的連線與z軸的夾角,方向角?是原點(diǎn)到信源的連線在x-y平面上的投影與x軸之間的夾角。陣元位置向量:第m個(gè)陣元與x軸之間的夾角為γm=2πm/M,該處的位置向量為
。信號(hào)的復(fù)包絡(luò)相位差:原點(diǎn)和第m個(gè)陣元接收到信號(hào)的復(fù)包絡(luò)間相位差為
。信號(hào)方向向量:UCA相對(duì)于波達(dá)方向?yàn)棣鹊男盘?hào)方向向量為
。雙耳聽(tīng)覺(jué)定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.3基于傳聲器陣列的聲源定位—概述基于傳聲器陣列的聲源定位算法大致可以分為以下三類:(1)基于最大輸出功率的可控波束形成算法,該方法對(duì)傳聲器陣列接收到的語(yǔ)音信號(hào)進(jìn)行濾波、加權(quán)求和,然后直接控制傳聲器指向使波束有最大輸出功率的方向。(2)基于到達(dá)時(shí)間差的定位算法,該方法首先求出聲音到達(dá)不同位置傳聲器的時(shí)間差,再利用該時(shí)間差求得聲音到達(dá)不同位置傳聲器的距離差,最后用搜索或幾何知識(shí)確定聲源位置。(3)基于高分辨率譜估計(jì)的定向算法,該方法利用求解傳聲器信號(hào)間的相關(guān)矩陣來(lái)確定方向角,從而進(jìn)一步確定聲源位置。12.3基于傳聲器陣列的聲源定位—基于最大輸出功率的可控波束形成算法基本原理:可控波束形成是一種早期的聲源定位算法,通過(guò)調(diào)節(jié)傳聲器陣列的接收方向來(lái)定位聲源。利用波束形成技術(shù),在整個(gè)接收空間內(nèi)掃描,尋找能量最大的方向作為聲源方位。通過(guò)濾波和加權(quán)求和處理接收到的聲源信號(hào),形成波束,然后搜索聲源可能的方位。波束形成器分類:(1)延遲累加波束算法:運(yùn)算量小,信號(hào)失真小,但抗噪性能較差,需要較多陣元;(2)自適應(yīng)波束算法:添加自適應(yīng)濾波環(huán)節(jié),運(yùn)算量較大,可能產(chǎn)生失真,但適用于陣元數(shù)較少的情況。延遲-求和波束形成法:通過(guò)校正傳聲器信號(hào)并求和,以期望從不同空間位置得到源信號(hào),同時(shí)削弱噪聲和混響影響,該方法定義為
。12.3基于傳聲器陣列的聲源定位—基于最大輸出功率的可控波束形成算法濾波-累加方法:在時(shí)間校正之前進(jìn)行濾波,以產(chǎn)生濾波-累加方法。該方法頻域表達(dá)式為
。波束輸出功率:定義為
,通過(guò)搜索使波束輸出功率最大的點(diǎn)來(lái)確定聲源方位。
12.3基于傳聲器陣列的聲源定位—基于到達(dá)時(shí)間差的定位算法概述:基于到達(dá)時(shí)間差的定位算法是語(yǔ)音增強(qiáng)和聲源定位領(lǐng)域的關(guān)鍵技術(shù),用于估計(jì)傳感器陣列中不同位置傳感器接收到的同源信號(hào)的時(shí)間差。步驟:第一步,進(jìn)行時(shí)延估計(jì),確定傳聲器陣列中不同傳聲器對(duì)同源語(yǔ)音信號(hào)的到達(dá)時(shí)間差(TDOA);第二步,根據(jù)TDOA和傳聲器的幾何位置,通過(guò)雙曲線方程確定聲源的方位和距離。二維和三維定位:在二維平面中,通過(guò)兩個(gè)傳聲器測(cè)定的時(shí)延和方位角可以確定聲源位置;在三維空間中,需要多個(gè)傳聲器來(lái)測(cè)定多個(gè)時(shí)延和方位角,以準(zhǔn)確確定聲源位置。12.3基于傳聲器陣列的聲源定位—基于到達(dá)時(shí)間差的定位算法廣義互相關(guān)(GCC)法:最廣泛應(yīng)用的時(shí)延估計(jì)方法,通過(guò)在頻域內(nèi)對(duì)信號(hào)進(jìn)行加權(quán)來(lái)抑制噪聲和反射的影響。自適應(yīng)濾波法:可以處理時(shí)變信號(hào),根據(jù)信號(hào)統(tǒng)計(jì)特性的變化自動(dòng)調(diào)節(jié)濾波器系數(shù),具有更好的魯棒性。實(shí)際模型:通過(guò)多個(gè)時(shí)延估計(jì)值對(duì)應(yīng)的雙曲線或雙曲面在空間上的交點(diǎn)確定聲源位置,可采用最小二乘擬合方法求出最優(yōu)解。12.3基于傳聲器陣列的聲源定位—基于到達(dá)時(shí)間差的定位算法實(shí)際應(yīng)用中的挑戰(zhàn):(1)時(shí)延估計(jì)和定位分為兩個(gè)階段,導(dǎo)致定位結(jié)果可能不是最優(yōu);(2)TDE技術(shù)主要適用于單聲源定位,多聲源定位效果較差;(3)在噪聲和混響較強(qiáng)的環(huán)境中,時(shí)延估計(jì)的誤差較大,影響定位精度。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計(jì)的定位算法概述:由現(xiàn)代高分辨譜估計(jì)技術(shù)發(fā)展而來(lái)的聲源定位算法,稱為子空間技術(shù)。子空間技術(shù)是一種在陣列信號(hào)處理領(lǐng)域廣泛應(yīng)用且基礎(chǔ)重要的技術(shù),它通過(guò)將接收數(shù)據(jù)分解為信號(hào)子空間和噪聲子空間,并利用這兩個(gè)子空間的正交性來(lái)提高聲源定位的分辨力。該技術(shù)已成功應(yīng)用于通信、雷達(dá)等領(lǐng)域,衍生出了如MUSIC和ESPRIT等算法,其中MUSIC算法通過(guò)噪聲子空間來(lái)估計(jì)信號(hào)的方向,而ESPRIT算法則利用信號(hào)子空間的旋轉(zhuǎn)不變特性來(lái)估計(jì)信號(hào)參數(shù),兩者都旨在提高定位精度并減少計(jì)算復(fù)雜度。MUSIC算法:利用信號(hào)子空間和噪聲子空間的正交性,通過(guò)構(gòu)造空間譜函數(shù)并搜索譜峰來(lái)檢測(cè)信號(hào)的DOA,其步驟如下:
12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計(jì)的定位算法(1)收集信號(hào)樣本(n),n=0,1,...,K-1,其中P為采樣點(diǎn)數(shù),估計(jì)協(xié)方差函數(shù)為
;(2)對(duì)進(jìn)行特征值分解,得
。式中為特征值對(duì)角陣,且從大到小順序排列
是對(duì)應(yīng)的特征向量;(3)利用最小特征值的重?cái)?shù)K,估計(jì)信號(hào)數(shù)
,并構(gòu)造噪聲子空間
;(4)搜索MUSIC空間譜,找出
個(gè)峰值,得到DOA估計(jì)值。
其局限性有:在低信噪比環(huán)境下,MUSIC算法可能無(wú)法分辨接近的信號(hào)源;陣列流形誤差對(duì)MUSIC算法的性能有顯著影響。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計(jì)的定位算法ESPRIT算法:利用傳感器陣列的旋轉(zhuǎn)不變特性,通過(guò)分解成兩個(gè)子陣列并利用它們的平移不變性來(lái)估計(jì)信號(hào)參數(shù)。與MUSIC算法不同,ESPRIT算法不需要知道陣列的幾何結(jié)構(gòu),因此對(duì)陣列的校準(zhǔn)要求較低。傳聲器陣列配置:一個(gè)由m個(gè)對(duì)偶極子組成的傳聲器陣列,分為兩個(gè)子陣列,對(duì)應(yīng)元素具有相同的敏感度模式和位移偏移量d。信號(hào)模型:D個(gè)獨(dú)立的窄帶信號(hào)源入射到陣列,每個(gè)信號(hào)源具有中心頻率ω0,并且每個(gè)信號(hào)源的入射方向由θk表示,兩個(gè)子陣列第i組對(duì)應(yīng)陣元的接收信號(hào)可以表示為12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計(jì)的定位算法向量表示:接收信號(hào)被表示為向量形式x(t)和u(t),其中包括陣列流形矩陣A(θ),旋轉(zhuǎn)因子矩陣Φ,以及噪聲向量nx(t)和nu(t)。陣列接收向量:定義了整個(gè)陣列的接收向量z(t),它是兩個(gè)子陣列接收向量的組合,并表示為自相關(guān)矩陣:計(jì)算了接收向量z(t)的自相關(guān)矩陣Rzz,可以表示為特征值分解:對(duì)自相關(guān)矩陣進(jìn)行特征值分解,其中最小的2m-D個(gè)廣義特征值對(duì)應(yīng)于噪聲,而最大的D個(gè)特征值對(duì)應(yīng)于信號(hào)。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計(jì)的定位算法旋轉(zhuǎn)不變結(jié)構(gòu)特性:利用陣列的旋轉(zhuǎn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年來(lái)賓市合山生態(tài)環(huán)境局招聘?jìng)淇碱}庫(kù)及參考答案詳解1套
- 會(huì)議發(fā)言與討論規(guī)范制度
- 2026年石獅市部分公辦學(xué)校赴西南大學(xué)公開(kāi)招聘編制內(nèi)新任教師52人備考題庫(kù)附答案詳解
- 2026年黑旋風(fēng)鋸業(yè)股份有限公司招聘?jìng)淇碱}庫(kù)及答案詳解參考
- 2026年香山社區(qū)衛(wèi)生服務(wù)中心招聘?jìng)淇碱}庫(kù)及完整答案詳解1套
- 中學(xué)學(xué)生社團(tuán)活動(dòng)經(jīng)費(fèi)管理監(jiān)督制度
- 2026年石獅市部分公辦學(xué)校赴西南大學(xué)公開(kāi)招聘編制內(nèi)新任教師52人備考題庫(kù)及答案詳解參考
- 2026年羅甸縣第二醫(yī)共體逢亭分院面向社會(huì)公開(kāi)招聘編制外衛(wèi)生專業(yè)技術(shù)人員備考題庫(kù)完整參考答案詳解
- 咸寧市第一高級(jí)中學(xué)2026年專項(xiàng)校園公開(kāi)招聘教師30人備考題庫(kù)及一套完整答案詳解
- 2026年阿里地區(qū)精神衛(wèi)生福利院招聘生活護(hù)理員的備考題庫(kù)及答案詳解參考
- 股骨下段慢性骨髓炎的護(hù)理
- 地基驗(yàn)槽(擋土墻)
- 環(huán)氧樹(shù)脂砂漿平涂地坪施工方案
- 2014FSC懸架答辯報(bào)告-太原理工
- 2023年省國(guó)資委選聘兼職外部董事人選模擬預(yù)測(cè)(共1000題)筆試備考題庫(kù)及答案解析
- 蘇教版六年級(jí)數(shù)學(xué)上冊(cè)期末試卷帶答案【可打印】-
- 2023年承德醫(yī)學(xué)院解剖學(xué)試題庫(kù)
- FZ/T 10004-2018棉及化纖純紡、混紡本色布檢驗(yàn)規(guī)則
- 2020年南京市獨(dú)角獸、瞪羚企業(yè)發(fā)展白皮書(shū)附下載
- 大體積混凝土保供方案1
- 大學(xué)項(xiàng)目支出績(jī)效評(píng)價(jià)辦法(試行)模板
評(píng)論
0/150
提交評(píng)論