數(shù)字語音處理基礎(chǔ)課件_第1頁
數(shù)字語音處理基礎(chǔ)課件_第2頁
數(shù)字語音處理基礎(chǔ)課件_第3頁
數(shù)字語音處理基礎(chǔ)課件_第4頁
數(shù)字語音處理基礎(chǔ)課件_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章數(shù)字語音處理基礎(chǔ)2.1語音信號的基本特性2.2發(fā)音的生理器官與過程2.3聽覺和感知2.4語音信號的特性分析方法簡介2.5語音學(xué)基礎(chǔ)及波形特征第1頁/共64頁2.1語音信號的基本特性(1)

語音信號(SpeechSignal):一般地,語音信號是指由人的發(fā)音器官所發(fā)出的聲音信號;廣義地說,我們所研究地語音信號可能包括人或其他動(dòng)物所發(fā)出的聲音信號以及環(huán)境噪聲和其他機(jī)械裝置(如樂器)所產(chǎn)生的聲音信號。其能量(信息)主要集中在0~4000Hz帶寬范圍內(nèi)。音頻信號(AudioSignal):人的聽覺系統(tǒng)所能感知的聲音信號,其頻率范圍在20~20,000Hz。電話語音信號由于語音信號的能量主要集中在0~4000Hz的頻帶內(nèi),因此傳統(tǒng)的電話語音通信系統(tǒng)中采用300~3400Hz的帶通濾波器來限制通過電話網(wǎng)絡(luò)傳輸?shù)恼Z音信號。語音信號處理研究的對象主要還是由人的發(fā)音器官所產(chǎn)生的語言聲音信號。第2頁/共64頁語音信號的基本特征:頻譜分量集中在300~3400Hz短時(shí)平穩(wěn)性 在5~50ms的短時(shí)內(nèi),信號的其本特征具有平穩(wěn)性: 能量過零率頻譜周期性語音信號的組成結(jié)構(gòu) 音素是語音信號的基本組成單位。 音素(Phoneme)->音節(jié)(Syllable)->詞(Word)->句子(Sentence)元音(Vowel)輔音(Consonant)音素音素濁音(Voice)清音(UnVoice)靜音(Silence)2.1語音信號的基本特性(2)第3頁/共64頁濁音 聲帶振動(dòng) 有周期性 頻譜上表現(xiàn)出共振峰特性清音 聲帶不振動(dòng) 頻譜上有噪聲特性靜音 環(huán)境噪聲產(chǎn)生的信號,與人的發(fā)音系統(tǒng)無關(guān)2.1語音信號的基本特性(3)第4頁/共64頁清音與濁音濁音(VoicedSpeech)聲帶的振動(dòng)產(chǎn)生準(zhǔn)周期的聲門脈沖激勵(lì)聲道產(chǎn)生濁音;在時(shí)域是準(zhǔn)周期的(quasi-periodic),在頻域具有諧波結(jié)構(gòu);周期脈沖的頻率就是基頻(FundamentalFrequency)或基音(Pitch);清音(UnvoicedSpeech)當(dāng)氣流在聲道中受到阻礙時(shí),產(chǎn)生湍流,此時(shí)生成清音。清音在時(shí)域類似隨機(jī)噪聲,在頻域具有寬帶特征;

第5頁/共64頁語音信號的時(shí)域波形時(shí)變特性:有時(shí)準(zhǔn)周期性、有時(shí)隨機(jī)噪聲特性平穩(wěn)性:在短時(shí)內(nèi)保持相同特性幅度特性:幅度時(shí)大時(shí)小男人可以在社會上參加一切活動(dòng)男。。。。。。。。。。。。人可。。。。。以。。。。。。。。。。第6頁/共64頁語音信號的短時(shí)譜(1)語音短時(shí)譜:從語音信號流中利用加窗的方法取出其中的一段,再對其進(jìn)行傅立葉變換,可以得到該“短時(shí)語音”的短時(shí)頻譜。濁音譜清音譜第7頁/共64頁語音信號的短時(shí)譜(2)濁音譜: 頻譜曲線比較規(guī)則,頻譜中具有幾個(gè)明顯的周期性起伏點(diǎn)。這些峰值點(diǎn)稱為共振峰(Formant),其對應(yīng)的頻率成為共振峰頻率,用F1、F2….表示,分別成為第一共振峰、第二共振峰、…。 一般地,共振峰有5~7個(gè),其中前三個(gè)攜帶大量地語音信息,對區(qū)分不同地語音非常重要。清音譜: 譜結(jié)構(gòu)較平坦,無明顯的周期性起伏結(jié)構(gòu); 沒有明顯的共振峰特性; 類似一般的隨機(jī)噪聲譜特性。第8頁/共64頁2.2發(fā)音的生理器官與過程第9頁/共64頁2.2發(fā)音的生理器官與過程

發(fā)聲器官主要由四個(gè)功能部分構(gòu)成:肺和氣管:動(dòng)力部分喉:激勵(lì)生成機(jī)構(gòu)聲道:受激勵(lì)系統(tǒng),它對聲音進(jìn)行調(diào)制,形成語音嘴:完成聲道氣流的輻射,形成聲波第10頁/共64頁2.2發(fā)音的生理器官與過程語音產(chǎn)生的機(jī)理圖肺活量

聲帶(聲門)咽腔軟腭鼻腔口腔氣管及支氣管鼻音口音主聲道:聲門以上,經(jīng)咽喉、口腔的管道。鼻道:經(jīng)小舌和鼻的管道稱為鼻道。次聲門系統(tǒng):經(jīng)肺、氣管和支氣管的管道。肌力第11頁/共64頁喉的構(gòu)造肺部氣流通過喉部構(gòu)成發(fā)音的動(dòng)力--激勵(lì)部分喉部發(fā)音器官的關(guān)鍵部位--聲帶聲帶之間的空隙--聲門

聲帶功能:吃東西時(shí)閉合,防止食物誤入肺中;來自肺部的發(fā)音氣流通過聲門時(shí),聲帶的開放與閉合,形成一個(gè)氣流脈沖,構(gòu)成發(fā)音的動(dòng)力部分。發(fā)濁音時(shí),氣流沖擊聲帶振動(dòng),產(chǎn)生周期性的氣流脈沖發(fā)清音時(shí),聲帶張開,氣流順利通過聲門

2.2發(fā)音的生理器官與過程——激勵(lì)第12頁/共64頁125Hz基因頻率時(shí),聲帶開啟的面積和時(shí)間的關(guān)系聲帶每開啟/閉合一次的時(shí)間(即聲帶的振動(dòng)周期)就是語音的基因周期,其倒數(shù)稱為基因頻率,通常約為50~450Hz成年男性:50~250成年女性:200~4502.2發(fā)音的生理器官與過程第13頁/共64頁通過聲門的周期性氣流的周期Tp稱為基音周期(PitchPeriod)Fp=1/Tp稱為基音頻率(FundamentalFrequency)不同年齡、不同性別的人發(fā)出的聲音的基因頻率有不同的特征: 老年人的聲帶松弛,基因頻率低 小孩的聲帶短,基因頻率高 女人的基因頻率普遍比男人高Fp男人50~250女人200~450基音頻率是我們區(qū)分不同人的聲音的主要特征之一2.2發(fā)音的生理器官與過程第14頁/共64頁2.2發(fā)音的生理器官與過程聲道縱剖面圖——調(diào)制第15頁/共64頁2.2發(fā)音的生理器官與過程氣流從喉向上經(jīng)過口腔或鼻腔后從嘴或鼻孔輻射出來所經(jīng)過的通道,即為聲道。聲道由咽喉、口腔和鼻腔組成。口腔是聲道最重要的部分,大小和形狀可通過調(diào)制舌、唇、齒和腭來改變。在調(diào)制發(fā)音時(shí),舌是最活躍的部分聲道是發(fā)音系統(tǒng)中的受激勵(lì)部分,聲道器官構(gòu)成的空腔系統(tǒng)對來自喉部的激勵(lì)信號進(jìn)行調(diào)制(濾波),形成語音信號。聲道具有短時(shí)平穩(wěn)性,即其在短時(shí)間內(nèi)(如20-50ms)的機(jī)械特性保持不變。聲道中決定其空腔特性的兩個(gè)重要器官:軟腭-其位置決定鼻音和非鼻音;舌-決定聲道最小橫截面積出現(xiàn)的位置,也是聲道頻率特性的決定因素。第16頁/共64頁2.2發(fā)音的生理器官與過程

聲道可以看作一種具有某種諧振特性的腔體,其腔體不同位置的諧振頻率就是對應(yīng)的共振峰頻率。語音信號的頻率特性一方面取決于聲門脈沖串特性,另一方面取決于聲道特性。一般成年男子聲道長約為17cm,最大橫截面積可達(dá)20cm2聲門鼻孔軟腭嘴唇

鼻孔和嘴唇完成聲道氣流的輻射,產(chǎn)生聲波。嘴的形狀會影響語音的頻譜特性,但較之聲道是次要的。一般成年男子鼻腔長約為10cm第17頁/共64頁2.2發(fā)音的生理器官與過程發(fā)不同音時(shí)咽腔的形狀變化第18頁/共64頁2.3聽覺和感知(1)人的發(fā)音器官構(gòu)成了語音產(chǎn)生系統(tǒng),人的聽覺器官則是語音信號的接收系統(tǒng)。具有顯著的物理機(jī)械特性,比較客觀,因此目前人類對發(fā)音器官的研究已經(jīng)比較透徹;但是聽覺系統(tǒng)則比較復(fù)雜,它與人的大腦和神經(jīng)系統(tǒng)緊密結(jié)合,形成人類對語言聲音的理解能力,目前對該領(lǐng)域的研究還很不完善。雖然人們對聽覺和感知系統(tǒng)的研究還很膚淺,但其中的很多成果仍在語音編碼、語言合成和語音識別系統(tǒng)中發(fā)揮了顯著效果。例如人耳的聽覺掩蔽效應(yīng)廣泛應(yīng)用于中低速率語音編碼系統(tǒng);在MP3編碼器中采用的心理聲學(xué)模型;在語音識別系統(tǒng)中,根據(jù)聽覺系統(tǒng)的處理特點(diǎn)所采用的預(yù)處理模塊。以下對人耳的基本結(jié)構(gòu)和人耳的感知特性作一個(gè)基本介紹。第19頁/共64頁聽覺和感知--人耳的基本結(jié)構(gòu)(2)外耳,其主要作用是(1)對聲源的定位;(2)對聲音的放大。 外耳道共振峰頻率約3000Hz。中耳,其主要作用是(1)三塊聽小骨構(gòu)成的鏈連接外耳和內(nèi)耳,實(shí)現(xiàn)聲阻抗的匹配;(2)保護(hù)內(nèi)耳。內(nèi)耳,其主要構(gòu)成部分是耳蝸。它是聽覺的受納器,聲音的機(jī)械振動(dòng)在耳蝸被轉(zhuǎn)換成神經(jīng)脈沖信號,并通過神經(jīng)系統(tǒng)傳送到大腦語言中樞。第20頁/共64頁聽覺和感知--耳蝸的頻率響應(yīng)(3)

聽覺產(chǎn)生過程聲波骨膜振動(dòng)聽小骨傳遞耳蝸基底膜振動(dòng)產(chǎn)生神經(jīng)脈沖第21頁/共64頁聽覺和感知--人耳的感知特性(4)聲音的物理參數(shù):頻率,振幅,頻譜特性,時(shí)間長度人耳對聲音的心里響應(yīng):音調(diào),響度,音色1。聽覺閾 人耳能接收的聲音信號頻率范圍:

20~20000Hz

人耳能忍受且感知的聲音強(qiáng)度:

130dB幾個(gè)聲學(xué)量概念定義如右:第22頁/共64頁聽覺和感知--響度和響度級(5)⒉響度和響度級-LoudnessandLoudnessLevel響度單位:

Sone(宋)-1kHz單音,聲強(qiáng)級40dB時(shí)聽到的響度。響度級單位:

Phon(方)-數(shù)值上等于具有等響度的1kHz的單音的聲強(qiáng)級。第23頁/共64頁聽覺和感知--響度和響度級(6)第24頁/共64頁聽覺和感知--音調(diào)(7)第25頁/共64頁聽覺和感知--掩蔽效應(yīng)(8)⒋掩蔽效應(yīng)MaskingEffect同時(shí)有兩個(gè)聲音進(jìn)入耳朵,響度比較大的聲音對弱的聲音有干擾,使人的耳朵對弱的聲音反映不敏感,稱為掩蔽效應(yīng)。①純音對純音的掩蔽—通常低音容易掩蔽高音②噪聲對純音的掩蔽臨界帶寬:當(dāng)白噪聲的總能量與純音的能量相同時(shí)所對應(yīng)的帶寬。第26頁/共64頁與聲音有關(guān)的幾個(gè)術(shù)語音高是人對聲波頻率的主觀屬性,它首先與聲波的頻率有關(guān)。聲波的振動(dòng)頻率高,我們聽到的聲音就高,反之亦然,但它們之間并非線性關(guān)系。音色是聲波波形的主觀屬性。不同的發(fā)音體所發(fā)出的音波都有自己的特異性。聲波的類型是多種多樣的,一般可分為純音和復(fù)合音兩大類。語音是特殊的復(fù)合音。語音由元音和輔音所構(gòu)成。元音是一種能連續(xù)發(fā)出的樂音,輔音主要是不能連續(xù)發(fā)出的短促的噪音,元音與輔音合成漢語音節(jié)。響度是聲波振幅的主觀屬性,它是由聲波的振幅引起的。振幅越大則響度越大,但它們之間也不是線性關(guān)系。第27頁/共64頁聲音質(zhì)量的評價(jià)我們經(jīng)常會對某一位歌手的歌聲發(fā)表意見,并與其他歌手進(jìn)行比較,這其實(shí)是在對聲音的質(zhì)量進(jìn)行評價(jià)。聲音質(zhì)量的評價(jià)是一個(gè)很困難的問題,也是一個(gè)值得研究的課題。目前來看,聲音質(zhì)量的度量有兩種基本方法,一種是客觀質(zhì)量度量,另一種是主觀質(zhì)量的度量。第28頁/共64頁聲音客觀質(zhì)量的度量方法聲波的測量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號,然后用電子儀表放大到一定的電壓級進(jìn)行測量與分析。由于計(jì)算技術(shù)的發(fā)展,使許多計(jì)算和測量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級聲學(xué)測量儀器,能完成下列一些測量工作:第29頁/共64頁評價(jià)值的測量響度和響度級,噪音級,清晰度指數(shù),噪音評價(jià)數(shù)。聲源的測量頻譜的時(shí)間變化,聲功率,指向性,效率,頻譜特征,幅值分布等。音質(zhì)的測量混響時(shí)間,隔音量,吸音量。聲音客觀質(zhì)量的度量方法第30頁/共64頁聲測量的基本儀器是聲級計(jì)。聲級計(jì)是一種能對聲音作出類似人耳的反應(yīng)的儀器,同時(shí),它能進(jìn)行客觀而可重復(fù)的聲壓和聲級測量。聲壓測量的好處很多:它能幫助音樂廳提高音響效果;能對煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級測量還能明確地告訴我們什么聲音會引起聽力損害,并提醒人們采用適當(dāng)?shù)穆犃ΡWo(hù)措施。因此,聲測量是不可少的。度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR(SignaltoNoiseRation),信噪比是有用信號與噪聲之比的簡稱。其單位是分貝(dB)。聲音客觀質(zhì)量的度量方法第31頁/共64頁聲音主觀質(zhì)量的度量采用客觀標(biāo)準(zhǔn)方法很難真正評定某種編碼器的質(zhì)量,在實(shí)際評價(jià)中,主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對某編碼器的輸出的聲音質(zhì)量進(jìn)行評價(jià),例如播放一段音樂,記錄一段話,然后重放給實(shí)驗(yàn)者聽,再由實(shí)驗(yàn)者進(jìn)行綜合評定。可以說,人的感覺機(jī)理最具有決定意義。當(dāng)然,可靠的主觀度量值是較難獲得的。第32頁/共64頁平均判分(MeanOpnionScose-MOS)過程是召集一批實(shí)驗(yàn)者,請每個(gè)實(shí)驗(yàn)者對某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分,采用類似于考試的五級分制,不同的MOS分對應(yīng)的質(zhì)量級別和失真級別見表4-1。聲音主觀質(zhì)量的度量第33頁/共64頁聲音主觀質(zhì)量的度量MOS質(zhì)量級別失真級別5優(yōu)(Excellent)不察覺4良(Good)剛察覺但不可厭3中(Fair)察覺及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)第34頁/共64頁聲音質(zhì)量分級與帶寬聲音的質(zhì)量與它所占用的頻帶寬度有關(guān),頻帶越寬,信號強(qiáng)度的相對變化范圍就越大大,音響效果也就越好。第35頁/共64頁按照帶寬可將聲音質(zhì)量分為4級:數(shù)字激光唱盤質(zhì)量,通常又CD-DA質(zhì)量,這種質(zhì)量也就是我們常說的超高保真,即SuperHiFi(HighFidelity)。調(diào)頻無線電廣播,簡稱FM(FrequencyModulation)質(zhì)量。調(diào)幅無線電廣播,簡稱AM(AmplitudeModulation)質(zhì)量。電話(Telephone)質(zhì)量。第36頁/共64頁4級聲音質(zhì)量的頻率范圍第37頁/共64頁2.4語音信號的特性分析方法簡介語音信號的特性:主要指其聲學(xué)特性、時(shí)域波形、頻譜特性以及信號的統(tǒng)計(jì)特性。聲學(xué)特性:包括前面講述的語音信號的產(chǎn)生機(jī)理、感知過程、屏蔽效應(yīng)等。統(tǒng)計(jì)特性:包括波形振幅概率密度函數(shù)和一些統(tǒng)計(jì)量如均值和自相關(guān)函數(shù)等。如概率密度的估算方法就是根據(jù)長時(shí)間范圍內(nèi)一段話音信號的大量樣本數(shù)據(jù)的幅度絕對值計(jì)算出幅度直方圖,然后,再根據(jù)統(tǒng)計(jì)的振幅直方圖,尋找近似的概率密度表達(dá)式。第38頁/共64頁語音信號的時(shí)域波形——實(shí)例1采樣頻率:8kHz量化精度:16bitA點(diǎn)開始[s],C點(diǎn)開始[k],都是清輔音,波形似白噪聲,振幅小,沒明顯周期性;B點(diǎn)開始[ou],D點(diǎn)開始的[e],都是元音,波形具有明顯的周期性,振幅較大,它們的周期對應(yīng)的就是聲帶振動(dòng)的頻率,即基音頻率,它是聲門脈沖的間隔從波形可計(jì)算估計(jì)值;考察其中一小段元音語音波形,從頻率特性大體可以看出它們的共振峰特性。第39頁/共64頁語音信號的頻譜特性——元音[ou]作法:從波形圖180ms處開始,取256個(gè)樣本:采樣率8k,則該音段持續(xù)時(shí)間為32ms。做FFT前,用hamming窗加權(quán),并用附加零點(diǎn)的辦法將信號延長一倍,以提高頻率分辨率。在0~1.83k之間有6個(gè)峰點(diǎn),因此基音頻率約為301Hz。觀察波形圖225~250ms之間大約有8個(gè)周期,由此可推斷周期約為300Hz.另外,圖中明顯的幾個(gè)凸起點(diǎn),它們出現(xiàn)的頻率即為共振峰頻率。元音頻譜具有明顯的共振峰特性第40頁/共64頁語音信號的頻譜特性——清輔音[k]可以看出,頻譜峰點(diǎn)之間的間隔是隨機(jī)的,表明清輔音[k]中沒有周期分量,與原來預(yù)計(jì)是一樣的。第41頁/共64頁語音信號的語譜圖——實(shí)例2“同舟共濟(jì)”的波形圖及對應(yīng)語圖窄帶語譜圖寬帶語譜圖第42頁/共64頁語譜圖相關(guān)概念實(shí)現(xiàn)方法:橫軸為時(shí)間,縱軸為頻率,沿時(shí)間軸計(jì)算給定時(shí)刻范圍(窗函數(shù))的短時(shí)譜,任一給定頻率成分在指定時(shí)刻的強(qiáng)弱用相應(yīng)點(diǎn)的灰度或色調(diào)的濃淡來表示。其本質(zhì)是一種動(dòng)態(tài)的頻譜。窄帶語譜圖,采用至少為兩個(gè)基音周期的“長”窗,通常選擇45Hz的帶寬。窄帶語譜圖具有較好的頻率分辨率,有利于顯示基音頻率及其各次諧波。但它的時(shí)間分辨率較差,不利于觀察共振峰(聲道諧振)的變化。寬帶語譜圖:選擇長度小于一個(gè)基音周期的“短”窗,通常帶寬為300Hz,頻域上表現(xiàn)為一個(gè)較寬的滑動(dòng)窗,有良好的時(shí)間分辨率和較差的頻率分辨率。寬帶譜能給出語音共振峰頻率及清輔音的能量匯集區(qū),在語圖上共振峰呈現(xiàn)為黑色的條紋。第43頁/共64頁語譜圖相關(guān)概念語譜圖特點(diǎn):花紋有橫杠(bar)、亂紋和豎直條等。橫杠:在(c)中與時(shí)間軸平行的幾條深黑色帶紋,相應(yīng)于短時(shí)譜中的幾個(gè)凸起點(diǎn),即共振峰。從橫杠對應(yīng)的頻率和寬度可確定相應(yīng)的共振峰頻率和帶寬。豎直條:又叫直沖條,是語圖中出現(xiàn)與時(shí)間軸垂直的一條窄黑條。每個(gè)豎條相當(dāng)于一個(gè)基音,條紋的起點(diǎn)相當(dāng)于聲門脈沖的起點(diǎn),條紋之間的距離表示基音的周期,條紋越密表示基音頻率越高。如圖中的[tong]中的[0],[ji]中的[i],指示了共振峰的存在。亂紋:輕擦音在語圖中的表現(xiàn)形式。如圖中的[zh]和[j]。亂紋的深淺和上下限反映了噪聲能量在頻域著那個(gè)的分布。第44頁/共64頁2.5語音學(xué)基礎(chǔ)及波形特征?語音流的單位:音素、音節(jié)、詞、節(jié)奏群和句子?音素:語音信號的最基本組成單位,音素可分為清音和濁音兩大類?音節(jié):由音素結(jié)合而成的語音流最小單位,是發(fā)聲的最小單位?詞:由音節(jié)結(jié)合而成的更大單位?節(jié)奏群和句子:詞的進(jìn)一步結(jié)合同一音素與不同音素結(jié)合時(shí),發(fā)音不同,如音素[sh]在發(fā)“詩”這個(gè)音與發(fā)“書”這個(gè)音時(shí),發(fā)音方式不完全一樣,前者是非圓唇音,后者是圓唇音。這種同一音素的不同發(fā)音方式稱為音素變體第45頁/共64頁語音分類第46頁/共64頁音節(jié)的構(gòu)成?音節(jié):包括元音和輔音?元音(Vowel):由聲帶振動(dòng)發(fā)出來的樂音,構(gòu)成了一個(gè)音節(jié)的主干,元音在音節(jié)中占主要部分。所有元音都是濁音?輔音(Consonant):由呼出的聲流克服發(fā)音器官的阻礙而產(chǎn)生的?發(fā)輔音時(shí)如果聲帶不振動(dòng),發(fā)出的輔音稱為清輔音?如果聲帶振動(dòng),發(fā)出的輔音則稱為濁輔音?輔音出現(xiàn)在音節(jié)的前端或后端或前后端?在漢語普通話中,每個(gè)音節(jié)都是由“輔音—元音”構(gòu)成(C—V結(jié)構(gòu))?在漢語語音中,輔音也稱為聲母,元音也稱為韻母第47頁/共64頁1~4段屬于聲母(輔音)6~9段屬于韻母(元音)第5段是聲母和韻母的過度段對一個(gè)具體指定的音節(jié),有可能只包含其中的某幾段,但第7段(主要元音段)是每一個(gè)音節(jié)都具有的一個(gè)音節(jié)的發(fā)音都可能由9部分組成第48頁/共64頁漢語的四聲在漢語語音中,通常采用聲、韻、調(diào)的系統(tǒng)分析方法,即每個(gè)“字音”分析為聲母(21個(gè))和韻母(39個(gè))兩部分,每個(gè)“字音”又有陰平、陽平、上聲和去聲四種聲調(diào)聲調(diào):發(fā)濁音時(shí),聲帶振動(dòng)的基頻軌跡。無論在說一個(gè)單音節(jié)或說一段連續(xù)語音時(shí),各個(gè)音節(jié)中韻母段的基頻都是隨時(shí)間變化的。聲調(diào)的構(gòu)字辨意作用:相同聲母和韻母構(gòu)成的音節(jié)隨聲調(diào)的不同而具有完全不同的意義,對應(yīng)著不同的漢字,例如搭、達(dá)、打、大。在許多其它語種中,聲調(diào)沒有這樣的重要作用。第49頁/共64頁聲調(diào)的曲線或軌跡開始于韻母的起始端,到韻母的終止端結(jié)束。陰平:曲線幾乎與時(shí)間橫軸線平行,且平均值很高。陽平:曲線從較低的頻率一直上升到較高的頻率,或起始處稍下降后一直上升。上聲:曲線先降后升。普通話4種聲調(diào)的典型曲線去聲:曲線從較高頻率出發(fā)一直下降到極低的頻率。注意:連續(xù)語音中的聲調(diào)曲線與單獨(dú)說一個(gè)音節(jié)的聲調(diào)曲線不完全相同。第50頁/共64頁元音元音(vowels)是因素中成員最多的一類,元音根據(jù)舌頭貼近上腭的位置(前部、中部和后部)分為三個(gè)子類。聲源:元音聲源是準(zhǔn)周期氣流,聲帶會以某一基本頻率振動(dòng)系統(tǒng):每個(gè)元音對應(yīng)一種不通的聲道形態(tài):第51頁/共64頁元音波形、語譜圖及共振峰表示元音特征會由于說話人的不同而有很大變化,舌頭隆起的位置和收緊程度、聲道截面積和長度,進(jìn)而聲道的共振鋒,都會隨說話人的不同而變化,因而有利于說話人的識別。語譜圖:聲道的形狀決定了它的共鳴特性。元音/a/的第一共振鋒占主導(dǎo)作用的大致在800Hz,第二、第三稍弱,分別在1200Hz和2300Hz;元音/i/,第一共振鋒大致在400Hz,第二、第三分別在2000Hz和3000Hz,第三共振鋒幅度比/a/的第三共振鋒要強(qiáng)。

第52頁/共64頁鼻音鼻音(nasals):最接近元音。聲源:也是從振動(dòng)的聲帶處噴射出的準(zhǔn)周期性氣流。系統(tǒng):軟腭下沉,氣流主要通過鼻腔,口腔通道緊縮,聲音從鼻孔處輻射出來。鼻音根據(jù)口腔通道中舌頭成阻的位置進(jìn)行區(qū)分:第53頁/共64頁鼻音波形、語譜圖及共振峰表示語譜圖:鼻腔有較大容積,頻譜成分主要為低頻諧振。高頻能量較低。第54頁/共64頁摩擦音—濁摩擦音和清摩擦音清摩擦音聲源:聲帶處于放松狀態(tài),不振動(dòng),口腔通道中某個(gè)收緊處的湍流會產(chǎn)生噪聲聲源,摩擦音聲道的收緊程度比元音還要窄。清摩擦音系統(tǒng):舌頭成阻的位置位于口腔通道后部、中部或前部,以及牙齒和嘴唇處。濁摩擦音有著類似清摩擦音的噪聲般聲源和系統(tǒng)特征,不同處是聲道收緊處產(chǎn)生噪聲時(shí),聲帶經(jīng)常會同時(shí)振動(dòng),能看到噪聲氣流的周期現(xiàn)象。第55頁/共64頁摩擦音波形、語譜圖及共振峰表示濁摩擦音有音柵結(jié)構(gòu),對應(yīng)的頻譜就具有相應(yīng)的諧波結(jié)構(gòu)。清摩擦音沒有類似特征。第56頁/共64頁爆破音—濁爆破音和清爆破音聲源和系統(tǒng)清爆破音:“爆破”產(chǎn)生原因是因?yàn)榭谇煌ǖ乐型耆茏杼幒蠓降臍鈮悍e聚并釋放所致。濁爆破音:不同的是釋放氣流的同時(shí)時(shí),聲帶發(fā)生振動(dòng)。第57頁/共64頁爆破音—VOT結(jié)論:濁爆破音比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論