版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
巴克刻 Bark版本反 version版本控 version Bayesiannonparametricmodels(BNP) variationalauto-encoder(VAE) editdistance辨認準確 identification標簽歧義 label波束賦 波形 采樣 sampling參數(shù)估 parameter測試正則 testnormalization(T-差分脈沖編 differencepulse-code longshort-termmemory(LSTM) 池 continuousintegration(CI) overlappedspeech串聯(lián)深度特 tandemdeep詞邊 word worderrorrate(WER) bagofwords worddiarizationerrorrate(WDER) falseaccept(FA) falsereject(FR)代碼可復用 code代碼評 code weightedfinite-statetransducer(WFST) singlepointoffailure(SPOF)單熱點向 one-hot單元測 unit SingleInstructionMultipleData(SIMD) 倒 equalerrorrate(EER) equal-loudnesscurve equivalentrectangularbandwidth(ERB) targetedvoiceseparation dynamictimewarping(DTW) short-timeFouriertransform(STFT) symmetricnormalization(S-norm)對抗學 adversarial多讀取 多風格訓 multi-style多模態(tài)說話人識 multimodalspeaker multi-tasklearning(MTL) multi-speakerrecognition二次分 耳 反欺 反向傳 roomimpulseresponse(RIR) unsupervisedlearning分 分層聚 hierarchical diarizationerrorrate(DER) assignmentmatrix分 傅里葉變 Fourier負載均 load probabilisticlineardiscriminantanalysis(PLDA) perceptuallinearpredictive(PLP) Gaussianmixturemodel(GMM) 個性化語音檢 personalvoiceactivity功 功率 power power-normalizedcepstralcoefficients(PNCC) 共振 buildautomation naturalfrequency elbowmethod歸一化指數(shù)函 softmax歸正損失函 regularization國際電信聯(lián) InternationalTelecommunication Hammingwindow Hanningwindow kerneltrick赫 候選說話 candidate混 基本事 ground吉布斯現(xiàn) Gibbs集成測 integration集成學 ensemble激活函 activation基 fundamental集 集束搜 beam計算 computational雞尾酒會問 thecocktailparty基 加 檢測代價函 detectioncost supervisedclustering supervisedlearning crossentropy鉸鏈損失函 hinge角頻 angular receiveroperatingcharacteristiccurve(ROC) 競爭冒 race agglomerativehierarchicalclustering(AHC) distancedependentChineserestaurantprocess(ddCPR) convolutionallayer卷積內(nèi) convolutional卷積神經(jīng)網(wǎng) convolutionalneural快速傅里葉變 fastFourier garbagein,garbageout(GIGO) classunbalance類內(nèi)平方 within-clustersumof withinclasscovariancenormalization(WCCN) discreteFouriertransform(DFT) discretecosinetransform(DCT) federatedlearning聯(lián)合因子分 jointfactor connectionisttemporalclassification(CTC) linkagecriterion連續(xù)聲紋識 continuousspeaker連通組 connected鄰接矩 adjacency domain-adversarialtraining zeronormalization(Z-norm) streamprocessing魯棒 錄入 enrollment邏輯回 logistic濾波器 碼 馬爾可夫 Markov pulse-codemodulation(PCM) 盲式分 blind冒名頂替 Mel-frequencycepstralcoefficients(MFCC) Melscale美國國家標準與技術(shù)研究所NationalInstituteofStandardsandTechnology(NIST) LinguisticDataConsortium(LDC) gatedrecurrentunit(GRU) power-lawcompression模擬信 analog模型預 目標說話 target奈奎斯特頻 Nyquist inverseshort-timeFouriertransform(ISTFT) inversediscreteFouriertransform(IDFT)歐氏距 Euclidean discriminativeneuralclustering(DNC)頻 頻 頻譜泄 spectral平凡 trivial譜聚 spectral 前饋神經(jīng)網(wǎng) feed-forwardneural嵌入 遷移學 transfer前 areaundercurve(AUC) fullsequenceinference nuisanceattributeprojection(NAP) speechseparation;voiceseparation軟件規(guī) software軟件生命周 software三連音 三元損失函 triplet深度聚 deep神經(jīng)網(wǎng) neural聲 vocal聲 vocal生理特 physiological聲碼 聲 聲 聲 voiceidentity;voiceprint;voice聲紋保 voice聲紋編碼 speaker聲紋辨 speakeridentification;speaker聲紋分割聚 speaker聲紋錄 voice聲紋濾 voiceembedding;speakerembedding speakerrecognition;talkerrecognition speakerverification聲紋注 voice聲紋轉(zhuǎn) voice biometriccharacteristic biometricsidentification acousticmodel聲源分 source時間分辨 temporal vectorquantization(VQ) 時頻譜增 issuetrackingsystem(ITS) restrictedBoltzmannmachine(RBM) dataaugmentation數(shù)字信 digital digitalsignalprocessor(DSP) 說話人轉(zhuǎn)換檢測speakerchangedetection(SCD)隨機梯度下降stochasticgradientdescent(SGD)隨機游走randomwalk損失函數(shù)loss特征間 梯度下降 gradient梯度消失問 vanishinggradient跳 停止準 stop Listen,Attendand統(tǒng)一計算架 computeunifieddevice universalbackgroundmodel(UBM) projectionmatrix圖的拉普拉斯矩 graph 完全連接網(wǎng) fullyconnected位置編 positional text-promptedspeakerrecognition text-independentspeakerrecognition text-dependentspeakerrecognition textnormalization握手通 unboundedinterleaved-staterecurrentneural無權(quán)重算數(shù)均值配對 UnweightedPair-GroupMethodusingArithmetic UnweightedPair-GroupMethodusingCentroids(UPGMC) undirectedweightedgraph線性脈沖編 linearpulse-code lineardiscriminantanalysis(LDA) linearpredictivecoding(LPC) linearpredictivecepstralcoefficient(LPCC) rectifiedlinearunit(ReLU)響 signal-to-noiseratio(SNR) behavioralcharacteristics learningrate循環(huán)神經(jīng)網(wǎng) recurrentneural循環(huán)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換 recurrentneuralnetworktransducer(RNN-掩 驗證 verification印度自助餐過 Indianbuffet hiddenMarkovmodel(HMM) 因子分 factor用 use directedacyclicgraph(DAG) cosinedistance余弦相似 cosine languagemodel(LM) speechsynthesis語音檢 voiceactivity speechrecognition;automaticspeechrecognition(ASR) speechenhancement原味循環(huán)神經(jīng)網(wǎng) vanilla韻律分 prosodic載荷矩陣loading在線代理指標onlineproxy增量調(diào)制deltamodulation幀采樣framesubsampling幀疊加framestacking trueaccept(TA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職交通運輸管理(交通流量調(diào)控)試題及答案
- 2025年高職(連鎖經(jīng)營管理)門店運營單元測試試題及答案
- 2025年高職(中藥制藥技術(shù))中藥制劑試題及答案
- 2025年高職藝術(shù)設(shè)計(藝術(shù)教育心理學案例分析)試題及答案
- 2026年音響設(shè)備銷售(安裝指導)試題及答案
- 痤瘡瘢痕科普
- 中國人工智能發(fā)展路線圖
- 醫(yī)患和諧主題小品
- 2025云南昆明市盤龍區(qū)博物館公益性崗位招聘2人備考題庫及答案詳解(奪冠系列)
- 2025新疆博樂市市場監(jiān)管局招聘2人備考題庫及完整答案詳解一套
- 中小企業(yè)專利質(zhì)量控制指引編制說明
- 旅游行業(yè)安全風險管控與隱患排查方案
- 專題15 物質(zhì)的鑒別、分離、除雜、提純與共存問題 2024年中考化學真題分類匯編
- DL-T5418-2009火電廠煙氣脫硫吸收塔施工及驗收規(guī)程
- 復方蒲公英注射液在痤瘡中的應用研究
- 高考數(shù)學專題:導數(shù)大題專練(含答案)
- 腘窩囊腫的關(guān)節(jié)鏡治療培訓課件
- 淮安市2023-2024學年七年級上學期期末歷史試卷(含答案解析)
- 課件:曝光三要素
- 2023-2024學年山東省淄博市臨淄區(qū)八年級(上)期末數(shù)學試卷(五四學制)(含解析)
- GB/T 10802-2023通用軟質(zhì)聚氨酯泡沫塑料
評論
0/150
提交評論