語音信號處理課件-短時傅立葉分析與綜合與聽覺特征_第1頁
語音信號處理課件-短時傅立葉分析與綜合與聽覺特征_第2頁
語音信號處理課件-短時傅立葉分析與綜合與聽覺特征_第3頁
語音信號處理課件-短時傅立葉分析與綜合與聽覺特征_第4頁
語音信號處理課件-短時傅立葉分析與綜合與聽覺特征_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

人耳感知原理SDTFT的兩種解釋1.濾波解釋2.調(diào)制解釋2021/10/10星期日1(1)2021/10/10星期日22021/10/10星期日3濾波觀點(3)(2)可解釋為x(n)調(diào)制到頻率ω02021/10/10星期日42021/10/10星期日5調(diào)制觀點(4)(3)式改寫為2021/10/10星期日62021/10/10星期日7信號調(diào)制1.載波特點:頻率較高2021/10/10星期日82.被調(diào)制信號一般來說,頻率遠低于載波2021/10/10星期日9調(diào)制后的信號2021/10/10星期日10語音信號的調(diào)制解釋語音可看作多個信號被調(diào)制到多個載波后疊加的結(jié)果2021/10/10星期日112021/10/10星期日122021/10/10星期日13二、語音聽覺系統(tǒng)(一個十分巧妙的音頻信號處理器)人類接收語音由人耳來完成,空氣振動由耳廓收集,經(jīng)外耳道而抵達鼓膜,鼓膜隨之振動,使鼓室中的空氣和聽骨鏈也發(fā)生振動,聽骨鏈的振動經(jīng)前庭窗(卵圓窗)激勵前庭淋巴,變?yōu)橐翰?,液波使位于基底膜上的螺旋器受到刺激,將神?jīng)沖動經(jīng)聽神經(jīng)傳到中樞而產(chǎn)生聽覺。2021/10/10星期日14正常人的聽覺系統(tǒng)是極為靈敏的,可聽聲的范圍為0.02Hz-20kHz??陕犅暤淖钚÷晧杭?dB)稱為聽閾。-5130dB,對低頻和高頻是不敏感的,聽閾為60dB,在1kHz附近最敏感。2021/10/10星期日15聲源聲壓/Pa聲壓級/dB飛機附近200140織布車間20100地鐵0.6390繁華街道0.06370普通談話0.0260安靜房間0.00240耳語0.0006330樹葉沙沙聲0.000220農(nóng)村靜夜0.000063102021/10/10星期日161.耳的結(jié)構(gòu)(外耳、中耳和內(nèi)耳)和功能

外耳:對聲源定位和對聲音放大的作用,由耳廓和外耳道組成?!疃事┒沸停渥饔檬鞘占曇?。☆外耳道直至鼓膜,其中充滿空氣,是一諧振腔,使諧振頻率附近的頻率成分有某些放大作用,導(dǎo)致聲音有某些失真。2021/10/10星期日17

外耳道的長度為2.5cm,對波長為其4倍作用的聲波能起到較好的放大作用,即有:4

2.5=10cm,3000-4000Hz聲波的波長為8.5cm-11.41cm,因此外耳道對這部分頻率的信號有擴音作用,10dB左右。外耳道2021/10/10星期日18中耳★

結(jié)構(gòu):總?cè)萘繛?立方厘米,內(nèi)含三塊聽小骨,錘骨、砧骨、鐙骨,其中錘骨與鼓膜相接觸,鐙骨則與內(nèi)耳的前庭窗相接觸?!?/p>

作用:進行阻抗變換,將中耳兩端的聲阻抗匹配起來;保護內(nèi)耳。在一定聲強范圍內(nèi),聽小骨實現(xiàn)聲音的線性傳遞,而在特強聲時,實現(xiàn)非線性傳遞。2021/10/10星期日19內(nèi)耳★

結(jié)構(gòu):主要部分是耳蝸,耳蝸長約3.5cm,呈螺旋狀盤繞2.5-2.75圈,是一個密閉的管子,內(nèi)部充滿了淋巴液。前庭窗鐙骨基底膜2021/10/10星期日20★

作用:將振動變換為神經(jīng)沖動。當(dāng)聲音傳入中耳時,鐙骨的運動經(jīng)過前庭窗引起耳蝸內(nèi)液體壓強的變化,從而引起行波沿基底膜的傳輸,引起基底膜的振動。不同頻率的聲音產(chǎn)生不同的行波,其峰值出現(xiàn)在基底膜的不同位置上。基底膜的振動導(dǎo)致沿基底膜分布的毛細胞的電位發(fā)生改變,引起神經(jīng)沖動,傳遞給大腦,產(chǎn)生聽覺。2021/10/10星期日21

如果信號是一個多頻率的信號,則產(chǎn)生的行波將沿著基底膜在不同的位置產(chǎn)生最大幅度,從這個意義上講,耳蝸就像一個頻譜分析儀,將復(fù)雜信號分解成各種頻率分量,這種作用稱為人耳的時頻分析特性。耳蝸在語音接收過程起著重要的作用。2021/10/10星期日22

人工耳蝸是一種電子裝置,能幫助重度及極重度耳聾患者獲得或重新恢復(fù)聽覺。它代替病變受損的聽覺器官,把聲音轉(zhuǎn)換成編碼的電信號傳入內(nèi)耳耳蝸,刺激分布在那里的聽神經(jīng),再由大腦產(chǎn)生聽覺。人工耳蝸2021/10/10星期日23

麥克風(fēng)接收聲音,并通過導(dǎo)線將其傳至言語處理器;言語處理器對聲音進行數(shù)字化、濾波編碼等處理,并將編碼信號經(jīng)導(dǎo)線傳至傳輸線圈;傳輸線圈將編碼信號通過耦合傳至皮下的接收器;接收器對編碼信號進行解碼;按信號選擇一定位置的電極,刺激耳蝸內(nèi)的聽神經(jīng)纖維,使其產(chǎn)生興奮,將信號傳入大腦,產(chǎn)生聽覺。人工耳蝸的工作原理2021/10/10星期日242.聲音傳入內(nèi)耳的途徑由空氣傳導(dǎo),稱為氣導(dǎo),其過程為:聲波

耳廓

鼓膜

聽骨

內(nèi)耳

基底膜上毛細胞電位改變

神經(jīng)沖動由骨傳導(dǎo),稱為骨導(dǎo),其過程為:聲波

顱骨

外淋巴振動

內(nèi)耳

基底膜上毛細胞電位改變

神經(jīng)沖動2021/10/10星期日253.人耳的兩個重要特性(1)耳蝸對聲信號的時頻分析特性(2)人耳的掩蔽效應(yīng)人耳的掩蔽(maskingphenomenon)效應(yīng):在一個強信號附近弱信號將變得不可聞,被掩蔽掉了。2021/10/10星期日26掩蔽閾值被掩蔽掉的不可聞信號的最大聲壓級稱為掩蔽門限和掩蔽閾值(maskingthreshold),在這個掩蔽閾值以下的聲音將被掩蔽掉。掩蔽效應(yīng)分為同時掩蔽(頻域掩蔽)和短時掩蔽(時域掩蔽)。同時掩蔽是指存在一個弱信號和一個強信號,當(dāng)其頻率接近時,強信號會提高弱信號的閾值,就會導(dǎo)致弱信號變得不可聞。2021/10/10星期日271kHz的聽閾1dB20dB4dB可聞聲3dB不可聞聲圖形描述2021/10/10星期日28同時出現(xiàn)的A聲和B聲,若原來A聲的閾值為50dB,由于另一個頻率不同的B聲的存在使得A聲的閾值提高了68dB,則B聲稱為掩蔽聲,A聲稱為被掩蔽聲。掩蔽量為68dB-50dB=18dB。數(shù)學(xué)描述2021/10/10星期日29

掩蔽效應(yīng)的作用當(dāng)只有A聲時,必須將聲壓級在50dB以上的聲音信號傳送出去,50dB以下的聲音是聽不到的。當(dāng)同時出現(xiàn)了B聲,由于掩蔽效應(yīng),使得A聲中的68dB以下的聲音是聽不到了,可以不予傳送,只是傳送50dB以上的信號。同時掩蔽時,掩蔽聲越強,掩蔽作用越大;掩蔽聲和被掩蔽聲的頻率越接近,掩蔽效果越明顯,當(dāng)頻率相同時,掩蔽效果最大。2021/10/10星期日30前向掩蔽:若被掩蔽聲A出現(xiàn)后,相隔(0.05s,2s)之內(nèi)出現(xiàn)了掩蔽聲B,對A起掩蔽作用,因為A聲尚未被人所反應(yīng)接收而強大的B聲已來臨。短時掩蔽前向掩蔽和后向掩蔽后向掩蔽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論