兒童病理語音結(jié)構(gòu)化采樣規(guī)范_第1頁
兒童病理語音結(jié)構(gòu)化采樣規(guī)范_第2頁
兒童病理語音結(jié)構(gòu)化采樣規(guī)范_第3頁
兒童病理語音結(jié)構(gòu)化采樣規(guī)范_第4頁
兒童病理語音結(jié)構(gòu)化采樣規(guī)范_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

兒童病理語音結(jié)構(gòu)化采樣規(guī)范本文件規(guī)定了兒童病理語音結(jié)構(gòu)化采樣的術(shù)語和定義、采樣方式、采樣過程及采樣目標等要求。本文件適用于2~6歲兒童病理語音結(jié)構(gòu)化采樣。2規(guī)范性引用文件本文件沒有規(guī)范性引用文件。3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1病理語音采樣pathologicalspeechsampling通過數(shù)碼音頻系統(tǒng)將病變語音聲波波形轉(zhuǎn)換成一連串的二進制數(shù)據(jù),從而記錄下原始模擬聲波在某一時刻的狀態(tài)。3.2采樣點samplepoints采集2~6歲兒童病理語音的隔音室。3.3采樣設(shè)備samplingequipment基于語音采樣標準化數(shù)據(jù)庫,對采樣的病理語音進行儲存的設(shè)備。3.4采樣分析技術(shù)samplinganalysistechnology病理語音結(jié)構(gòu)化采樣標準涉及一種病理語音采樣方法,特別是一種基于MFCC特征提取的可以用于人工智能運算的標準化采樣方法。3.5采樣類型辨別sampletypediscrimination在病理語音采樣類別中,智能辨別兒童病理語音種類的操作。4采樣方式4.1人工病理語音采樣在采樣點,受試者使用普通話或粵語按照附錄A《中國構(gòu)音障礙語音評估系統(tǒng)詞表》(簡稱詞表)的順序讀取82個漢語的語音,檢查者通過采樣設(shè)備進行病理語音采樣。4.2智能病理語音采樣通過采樣分析技術(shù)篩選出評估各型兒童病理語音的權(quán)重聲學(xué)特征參數(shù),基于權(quán)重聲學(xué)特征通過構(gòu)建ANN實現(xiàn)2~6歲兒童病理語音的采樣類型辨別。5采樣過程5.1采樣點環(huán)境選擇最佳采樣點環(huán)境是在具有隔音門、吸音巖綿的隔音室內(nèi)進行,隔音度不小于40dB。5.2采樣設(shè)備的基礎(chǔ)參數(shù)要求采樣設(shè)備需要具備44.1kHz的采樣率和16bit的音質(zhì)。5.3病理語音采樣數(shù)據(jù)采集5.3.1按照詞表中的82個漢語詞匯,對受試者進行錄音,采集82個漢語音節(jié)的病理語音樣本。5.3.2受試者應(yīng)端坐,口唇距采樣設(shè)備約10cm,語速自然平穩(wěn)、音量適中,將詞表重復(fù)錄2次,如遇不認識的字檢查者應(yīng)予以告知。5.4采樣處理5.4.1用語音剪輯軟件(CoolEditPro2.1)將受試者第一次錄音的82個目標音檔剪切出來。5.4.2分類歸檔,其中單元音28個,復(fù)合元音23個,輔音21個,序列語音10個。5.4.3如果第一次錄音出現(xiàn)噪音、干擾、波形超過窗口值、波形提示能量不足等情況,則選用第二次錄音數(shù)據(jù)進行處理。如果再次出現(xiàn)噪音、干擾、波形超過窗口值、波形提示能量不足等情況需重新采樣。5.5采樣分析5.5.1概述通過預(yù)加重、分幀、加窗、快速傅里葉變換、三角帶通濾波器、濾波代入、擴展分幀等處理過程,提取每個音節(jié)的每一個數(shù)字語音信號的MFCC特征,形成MFCC語音庫。5.5.2預(yù)加重5.5.2.1預(yù)加重的作用:a)使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比來獲得頻譜;b)消除發(fā)音過程中聲帶和嘴唇的相互效應(yīng),從而補償語音。5.5.2.2將采樣點采集的病理語音采樣信號通過高通濾波器進行高通預(yù)加重處理,其處理公式(1)如下:.....................(1)H(Z)——高通預(yù)加重值;z——頻譜。5.5.3分幀5.5.3.1規(guī)定時間以25ms為一分幀。5.5.3.2為了避免相鄰兩幀的變化過大,兩相鄰幀之間重疊區(qū)域應(yīng)設(shè)置為10ms。5.5.3.3每一個語音樣本取第13分幀和第19分幀,若語音樣本時長不足,補零。5.5.4加窗分幀后將每一幀乘以漢明窗(HammingWindow以增加幀左端和右端的連續(xù)性。假設(shè)分幀后的信號為S(n),其中n=0,1,...N-1;N=13和N=19,即幀的大小,那么乘上漢明窗后的信號值為x(n),其公式(2)如下:x(n)=s(n)xw(n)......................(2)x(n)——加窗信號值;S(n)——分幀后信號值;W(n)——漢明窗。漢明窗提取公式(3)如下:...................(3)W(n,a)——漢明窗提取值;n——分幀后幀的大?。籥——分幀剔除值,a值取0.46;N——幀的大小。5.5.5快速傅里葉變換5.5.5.1對分幀加窗后的各幀信號進行快速傅里葉變換得到各幀的頻譜值。5.5.5.2對語音信號的頻譜值取模平方得到語音信號的功率譜。5.5.5.3設(shè)定語音信號的離散傅里葉變換(DFT)公式(4)如下:(k)——離散傅里葉變換;N——傅里葉變換點數(shù);n——分幀;k——離散傅里葉變換點數(shù)。上式中x(n)為輸入的語音信號,N表示傅里葉變換的點數(shù)。...................5.5.6三角帶通濾波器5.5.6.1將Xa(k)通過一組24個三角形濾波器,該濾波器中心頻率指定為f(m),m=1,2,...,24。各f(m)之間的間隔隨著m值的減小而縮小,隨著m值的增大而增寬,如圖1示。圖1Mel頻率濾波器組模式圖5.5.6.2三角帶通濾波器對病理語音采樣獲取的樣本頻譜數(shù)據(jù)進行處理的作用為:a)對病理語音采樣獲取的樣本頻譜進行平滑化處理,并對頻譜起到消除諧波的作用;b)降低后續(xù)采樣分析中對樣本頻譜數(shù)據(jù)的采樣樣板辨別的算法計算量。5.5.6.3計算數(shù)頻率值的三角帶通濾波器公式(5)如下:..........................................Hmk——三角濾波器組值;f(m)——三角濾波器中心頻率;m——三角濾波器個數(shù)。上式中,5.5.7濾波代入每個濾波器組輸出的對數(shù)頻率值,Hm(k)代入公式(6s(m)=In億xa(k)[2Hm(k)),0?m≤M 離散余弦變換(DCTS(m)代入公式(7 S(m)——每個濾波器組輸出的對數(shù)頻率值;N——傅里葉變換點數(shù);k——離散傅里葉變換點數(shù);(k)——離散傅里葉變換;HmL——MFCC系數(shù)階數(shù);C(n)——每一分幀MFCC值。每一分幀的MFCC值。13階和19階各分幀連接獲得2組MFCC值入5.5.8擴展分幀將三角濾波器中獲得的共振峰F1、F2和F0各中點值,作為一個分幀加入A組、B組,獲得2組MFCC入庫,即C組、D組5.5.9MFCC語音庫5.5.9.1MFCC語音庫包括病理語音采樣標準化數(shù)據(jù)和采樣類型辨別結(jié)構(gòu)化數(shù)據(jù)。5.5.9.2病理語音采樣標準化數(shù)據(jù):82個音節(jié)樣本的每一個音節(jié)數(shù)據(jù)經(jīng)預(yù)處理后分別是13幀、19幀、13+3幀、19+3幀的標準化數(shù)據(jù)入A、B、C、D四組。5.5.9.3采樣類型辨別結(jié)構(gòu)化數(shù)據(jù):將標準化數(shù)據(jù)分別錄入元音與聲調(diào)、輔音、復(fù)合元音、序列數(shù)字等四個子庫的A、B、C、D組。6采樣目標6.1明確兒童病理語音與正常兒童及組間的聲學(xué)特征差異與規(guī)律6.1.1采樣點通過對采樣設(shè)備進行病理語音采樣采集到的樣本進行處理和分析后,將樣本的每個音節(jié)處理為標準化和結(jié)構(gòu)化數(shù)據(jù),以適應(yīng)病理語音庫構(gòu)建、大數(shù)據(jù)語音分析和人工智能運算的需求。6.1.2通過采樣處理后提取到的共振峰、基頻、時長、塞音(VOT)等相關(guān)的聲學(xué)特征參數(shù),并分析計算出病理語音樣本的標準化和結(jié)構(gòu)化數(shù)據(jù)中具備元音三角(VSA)、元音發(fā)音指數(shù)(VAI)、共振峰集中率(FCR)、元音橢圓離散度等聲學(xué)參數(shù),應(yīng)不少于25種。6.1.3通過大數(shù)據(jù)語音分析和人工智能運算,可完整分析出2-6歲兒童病理語音與正常語音的聲學(xué)特征差異和變化規(guī)律。6.2評估各型兒童病理語音的權(quán)重聲學(xué)特征參數(shù)6.2.1根據(jù)兒童病理語音和正常兒童,分別建立5個結(jié)構(gòu)化語音數(shù)據(jù)集。每個數(shù)據(jù)集中每個樣本語音6.2.2采樣類型辨別能通過數(shù)據(jù)挖掘的方法選擇與優(yōu)化用于評估2-6歲兒童病理語音特征聲學(xué)參數(shù)。6.2.3根據(jù)病理語音采樣預(yù)估數(shù)據(jù)特征選取Lasso分析,將每種類型的兒童病理語音進行二分類變量(C1,C2,...,C4)分類,為采樣類型辨別提供數(shù)據(jù)基礎(chǔ)。6.2.4通過LASSO分析,明確影響采樣類型辨別中的25種變量因素的比例權(quán)重,并精確確定用于兒童病理語音評估的綜合權(quán)重因變量,即權(quán)重聲學(xué)特征,提高信效度。6.3基于權(quán)重聲學(xué)特征通過構(gòu)建ANN實現(xiàn)兒童病理語音類型辨別6.3.1將獲取到的兒童病理語音樣本的權(quán)重因變量(例如,V1,V8,...,V22)為輸入變量,ANN四分類疾病作為輸出變量,輸入ANN神經(jīng)網(wǎng)絡(luò),獲取兒童病理語音權(quán)重變量。6.3.2基于聲學(xué)特征的ANN模型對兒童病理語音識別的效率與影響機制,提高權(quán)重聲學(xué)特征參數(shù)進行人工智能、客觀評估兒童病理語音疾病的信效度。中國構(gòu)音障礙語音評估系統(tǒng)詞表A.1中國構(gòu)音障礙語音評估系統(tǒng)詞表包括元音、聲調(diào)、系列語言、元音變化、部分韻母和輔音等內(nèi)容,具體內(nèi)容見表A.1、表A.2和表A.3的規(guī)定。表A.1規(guī)定了文件中使用的中國構(gòu)音障礙語音評估系統(tǒng)詞表的元音、聲調(diào)、系列語言。表A.1中國構(gòu)音障礙語音評估系統(tǒng)詞表(元音、聲調(diào)、序列語言)表A.1中國構(gòu)音障礙語音評估系統(tǒng)詞表(元音、聲調(diào)、序列語言)(續(xù))表A.2規(guī)定了文件中使用的中國構(gòu)音障礙語音評估系統(tǒng)詞表的元音變化和部分韻母。表A.2中國構(gòu)音障礙語音評估系統(tǒng)詞表(元音變化、部分韻母)表A.3規(guī)定了文件中使用的中國構(gòu)音障礙語音評估系統(tǒng)詞表的輔音。表A.3中國構(gòu)音障礙語音評估系統(tǒng)詞表(輔音)A.2中國構(gòu)音障礙語音評估系統(tǒng)詞表說明:a)表A.1由38個漢字構(gòu)成,覆蓋a、i、u、o、e、ü

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論