版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Windows語音助手
軟件需求闡明書
文檔編號(hào):D01
版本號(hào):VI.1
編寫:—編寫日期:
校對(duì):校對(duì)U期:
FirstDreamTeam團(tuán)體開發(fā)人員
開發(fā)單位:青島大學(xué)——FirstDreamTeam團(tuán)體
項(xiàng)目負(fù)責(zé)人:
令文檔修改記錄
修改人修改時(shí)間版本號(hào)備注
*1*2023-6-20VI.0初次編寫
*JXKW
*T**T**T*2023-6-30VI.1調(diào)整需求,重點(diǎn)強(qiáng)調(diào)項(xiàng)目功能需求
?X**1*
4、*T*■卜*7*2023-7-10VI.3細(xì)化需求,重新調(diào)整文檔構(gòu)造。
S*x
*1**1*2023-8-1V1.4統(tǒng)一文檔構(gòu)造。
3.2功能需求實(shí)例圖..............................................錯(cuò)誤!未定義書簽。
3.2功能需求流程圖..............................................錯(cuò)誤!未定義書簽。
3.2功能------語音識(shí)別與輸入..................................錯(cuò)誤!未定義書簽。
功能闡明......................................................錯(cuò)誤!未定義書簽。
功能描述......................................................錯(cuò)誤!未定義書簽。
3.3功能二一一屏幕取詞..........................................錯(cuò)誤!未定義書簽。
功能闡明......................................................錯(cuò)誤!未定義書簽。
功能描述......................................................錯(cuò)誤!未定義書簽。
3.4功能二——語音?控制..........................................錯(cuò)誤!未定義書簽。
功能闡明......................................................錯(cuò)誤!未定義書簽。
功能描述......................................................錯(cuò)誤!未定義書簽。
3.5功能四一一語音精靈..........................................錯(cuò)誤!未定義書簽。
功能闡明......................................................錯(cuò)誤!未定義書簽。
功能描述......................................................錯(cuò)誤!未定義書簽。
3.6功能五一一語音朗誦(TTS)........................................................................錯(cuò)誤!未定義書簽。
功能闡明......................................................錯(cuò)誤!未定義書簽。
功能描述......................................................錯(cuò)誤!未定義書簽。
四.運(yùn)行規(guī)定....................................................錯(cuò)誤!未定義書簽。
4.1顧客界面..................................................錯(cuò)誤!未定義書簽。
4.2硬件接口..................................................錯(cuò)誤!未定義書簽。
4.3軟件接口..................................................錯(cuò)誤!未定義書簽。
4.4通信接口(無)...........................................錯(cuò)誤!未定義書簽。
一.引言
1.1編寫目的
該文檔對(duì)所開發(fā)的Windows語音助手抵達(dá)功能、性能、顧客界面及運(yùn)行環(huán)境
等作出了詳細(xì)的闡明。他作為對(duì)該系統(tǒng)概要設(shè)計(jì)口勺根據(jù),協(xié)助開發(fā)人員理解本系統(tǒng)
R勺框架思想及實(shí)現(xiàn)功能,并驗(yàn)證核算該產(chǎn)品能否滿足顧客規(guī)定的原則,便于技術(shù)文
檔和需求變化的管理。同步也是顧客與開發(fā)人員雙方對(duì)軟件需求獲得共同理解的
基礎(chǔ)。
預(yù)期讀者:大賽評(píng)委、項(xiàng)目投資商、產(chǎn)品顧客、開發(fā)人員,指導(dǎo)老師.
1.2項(xiàng)目背景
■系統(tǒng)名稱:Windows語音助手
?任務(wù)提出者:
■開發(fā)者:青島大學(xué)FirstDreamTeam團(tuán)體。
■面向顧客:
1、但愿可以借助語音系統(tǒng)愈加緊捷、以便日勺操作電腦的顧客。
2、無法很好運(yùn)用鼠標(biāo)或鍵盤對(duì)電腦進(jìn)行操作日勺殘障人士顧客。
?特此申明:此軟件口勺開發(fā)作為后期商業(yè)項(xiàng)目的原型,均采用授權(quán)開發(fā)工具,產(chǎn)品
擁有自主知識(shí)產(chǎn)權(quán),未經(jīng)容許不得隨意傳播或使用。
1.3定義
,SDK:SDK就是SoftwareDevelopmentKitH勺縮寫,中文意思就是
“軟件開發(fā)工具包”。這是一種覆蓋面相稱廣泛的名詞,可以這樣說:輔助開
發(fā)某一類軟件的有關(guān)文檔、范例和工具的集合都可以叫做“SDK”。
■TTS
全稱為:TextToSpeech即文本合成語音,此為SAPI的基本類型之一,
TTS可以將文本中的)字符或文檔合成為語音并“說"出來。
■SR
全拼:SpeechRecognise即語音識(shí)別,此也為SAPI的基本類型之二,
SR則可以把人說話H勺語音轉(zhuǎn)換為易讀H勺字符或文檔。
?SAPI
SAPI又稱語音應(yīng)用程序編程接口,它減少了語音識(shí)別和語音合成應(yīng)用
中的程序代碼,使得語音技術(shù)在廣泛和蓬勃發(fā)展的實(shí)際應(yīng)用中更輕易使
用。SAPI使得應(yīng)用程序和語音引擎之間高度緊密的結(jié)合。SAPI可以實(shí)
時(shí)處理多種語音引擎在底層工作中口勺細(xì)節(jié)。
SAPI包括文本合成語音應(yīng)用程序接II,語音識(shí)別應(yīng)用程序接口。
SAPI日勺兩種基本類型是文本合成語音(TTS)引擎和語音識(shí)別
(SR)引擎。
WindowsAPI(Win32API)
WindowsAPI是一套用來控制Windows曰勺各個(gè)部件(從桌面的外觀到為
一種新進(jìn)程分派的內(nèi)存)的外觀和行為的一套預(yù)先定義的Windows函數(shù).顧客
日勺每個(gè)動(dòng)作都會(huì)引起?種或幾種函數(shù)的I運(yùn)行以告訴Windows發(fā)生了什么.
API函數(shù)包括在Windows系統(tǒng)目錄下日勺動(dòng)態(tài)連接庫文獻(xiàn)中(如
User32.dll;GDI32.dll,Shell32.dll...).
1.4參照資料
1.大賽題目設(shè)置《Windows語音助手》的有關(guān)詳細(xì)規(guī)定。
2.參照書籍:
?!墩Z音識(shí)別與控制應(yīng)用技術(shù)》
劉幺和,宋庭新編著
出版社:科學(xué)出版社
出版時(shí)間:2023-2-1
令《新編API大全》2023版
?MicrosoftMSDN
?MicrosoftSpeechSDK5.1Help
<《C#開發(fā)技巧大全》中國水利出版社
?《C#數(shù)據(jù)安全手冊(cè)》人民郵電出版社
?《C#高級(jí)編程》-清華大學(xué)出版社
?《國標(biāo)軟件產(chǎn)品需求規(guī)格闡明書》
?《國標(biāo)可行性分析匯報(bào)》
?《軟件工程》
作者:曾建潮
ISBN:
出版社:武漢工大
出版日期:2023-5-1
?《軟件工程與軟件文檔寫作》
作者:文斌,劉長青,田原編著
ISBN:2,
出版社:清華大學(xué)出版社
出版日期:2023-8-1
?《軟件需求工程》
作者黃國興周勇
出版社清華大學(xué)出版社
書號(hào)302-16860-7
出版時(shí)間2023年4月字?jǐn)?shù)千字
二.任務(wù)概述
項(xiàng)目最終采用最新微軟.NET技術(shù),并結(jié)合微軟最新語音識(shí)別引擎,通過語音輸
入抵達(dá)對(duì)計(jì)算機(jī)日勺基本控制。本項(xiàng)目在VisualStudio2023集成開發(fā)環(huán)境下開發(fā),
基于.NET及Speech語音引擎平臺(tái)。給客戶帶來以便快捷的全新體驗(yàn)。
2.1語音識(shí)別技術(shù)的來源與發(fā)展前景
語音識(shí)別技術(shù)簡介
智能翻譯機(jī)、語音撥號(hào)、語音查詢、語音自動(dòng)定票系統(tǒng)、語音工業(yè)控制等等,可以想見,凡
用計(jì)算機(jī)的地方都會(huì)有語音識(shí)別。在計(jì)算機(jī)輔助教育方面,計(jì)算機(jī)就成為專業(yè)的家庭輔導(dǎo)教
師;在幼兒進(jìn)行啟蒙教育的玩具中,語音識(shí)別也將倍受歡迎。
電腦語音合成技術(shù)即CTI(ComputerTelephoneIntegration),是用計(jì)算機(jī)技術(shù)處理語音。
一般是建一種信息呼喊中心,顧客打來時(shí)計(jì)算機(jī)會(huì)自動(dòng)地一層層地轉(zhuǎn)給有關(guān)部門,一直
到為顧客處理問題為止。有口勺語音信箱可以支持不同樣語種。CTI并非新技術(shù)。與網(wǎng)絡(luò)把
數(shù)據(jù)壓縮打包進(jìn)行傳播有所不同樣,CTI究竟還是一種語音模擬傳播技術(shù),只不過用上了計(jì)
算機(jī)對(duì)語音進(jìn)行智能管理而己。發(fā)達(dá)國家早幾年就普及了這項(xiàng)應(yīng)用,”是個(gè)機(jī)構(gòu)就有呼喊中
心”,以保證客戶或合作伙伴打來的I每一種均有回應(yīng)。中國卻還沒有走到這一步,目前除
了電信部門普遍開通了“呼喊中心”服務(wù)之外,大多數(shù)企業(yè)還剛剛起步。這個(gè)差距反應(yīng)了管
理和競爭意識(shí)方面口勺問題,
中文語音瀏覽器產(chǎn)品“Interversa”使我們可以用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。
Interversa已針對(duì)PentiumllllftSSE指令集進(jìn)行了優(yōu)化,井將在PentiumHI上實(shí)現(xiàn)最佳佐性能
和識(shí)別率。
常見時(shí)語音識(shí)別系統(tǒng)尚有“命令和控制(Command&Control)”(是持續(xù)的,擁有小詞匯量和
獨(dú)立揚(yáng)聲器)、“語音導(dǎo)航”、微軟的“不持續(xù)聽寫(DiscreteDictation)”(是不持續(xù)、大詞匯
量和非獨(dú)立揚(yáng)聲器的J),IBM的ViaVoice則屬于持續(xù)聽寫。
語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)閷?duì)應(yīng)的文本或命
令的高技術(shù),也就是讓機(jī)器聽懂人類的語音。也就是說,假如電腦配置有“語音辨識(shí)”的程
序組,那么當(dāng)你的聲音通過一種轉(zhuǎn)換裝置輸入電腦內(nèi)部、并以數(shù)位方式儲(chǔ)存后,語音辨識(shí)程
療便開始以你輸入的聲音樣本與事先儲(chǔ)存好的聲音樣本進(jìn)行對(duì)比工作。聲音對(duì)比工作完畢之
后,電腦就會(huì)輸入一種它認(rèn)為最“象”的聲音樣本序號(hào),就可以懂得你剛剛念的聲音是什么
意義,進(jìn)而執(zhí)行此命令。說起來簡樸,但要真正建立辨識(shí)率高的語音辨識(shí)程序組,卻是非常
困難而專業(yè)的b世界各地肉學(xué)者們也還在努力研究最佳的方式。專家學(xué)者們研究出許多破解
這個(gè)問題的I措施,如傅立葉轉(zhuǎn)換、倒頻譜參數(shù)等,使目前的語音辨識(shí)系統(tǒng)已抵達(dá)一種可接受
的程度,并且辨識(shí)度愈來愈高。
本項(xiàng)目是一種基于語音識(shí)別口勺i種智能化服務(wù)產(chǎn)品,是面向服務(wù)設(shè)計(jì)的成功案例之一。
語音識(shí)別技術(shù)的應(yīng)用
語音識(shí)別技術(shù)的應(yīng)用重要有如下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲
很高,由于使用鍵盤、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,尤其是不
懂英語或不熟悉漢語拼?&的人被拒之于門外,影響到電子計(jì)算機(jī)的深入普及。語音識(shí)別技術(shù)
時(shí)采用,變化了人與計(jì)算機(jī)的互動(dòng)模式,人們只需動(dòng)動(dòng)口,就能打開或關(guān)閉程序,變化工作界
面。這種使電腦人性化的成果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。
仍是目前使用最為普遍的通信工具,通過與語音識(shí)別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語音撥
號(hào)、購物以及通過辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。很快,能按
主人口令接通、打開收音機(jī),以及通過聲紋識(shí)別來者身份的安全系統(tǒng)也將獲得應(yīng)用。
語音識(shí)別技術(shù)的另首先應(yīng)用便是語音輸入和合成語音輸出。目前,已經(jīng)出現(xiàn)能將口述的
文稿輸入計(jì)算機(jī)并按指定格式編排U勺語音軟件,它比通過鍵盤輸入在速度上要提高2?4倍。
裝有語■&軟件的電腦還能通過語音合成把計(jì)算機(jī)里"勺文獻(xiàn)用多種語言“讀”出來,這將大大
推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)的發(fā)展。
在現(xiàn)階段,語音技術(shù)重要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對(duì)于節(jié)省人力、
時(shí)間,提高工作效率將起到明顯的作用。能實(shí)現(xiàn)自動(dòng)翻譯H勺語音識(shí)別系統(tǒng)目前也正在研究、
完善之中。
語音識(shí)別技術(shù)的發(fā)展
語音識(shí)別技術(shù)是2023年至2023年間信息技術(shù)領(lǐng)域十大重要II勺科技發(fā)展技術(shù)之一。它是一
門交叉學(xué)科,正逐漸成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)。語音識(shí)別技術(shù)與語音合成技術(shù)結(jié)
合使人們可以甩掉鍵盤,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一種具有競爭性
的新興高技術(shù)產(chǎn)業(yè)。
與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢(mèng)寐以求的事情。語音識(shí)別
技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)閷?duì)應(yīng)的文本或命令的高技術(shù)。語音識(shí)
別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)獲得明顯進(jìn)步,開始從試驗(yàn)室走向市場。人
們估計(jì),未來23年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服
務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。
語音識(shí)別聽寫機(jī)在某些領(lǐng)域的應(yīng)用被美國新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。諸
多專家都認(rèn)為語音識(shí)別技術(shù)是2023年至2023年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)
之一。
語音識(shí)別產(chǎn)品將是繼、計(jì)算機(jī)、Internet之后信息產(chǎn)業(yè)界口勺又一次革命。
假如我們可以突破人機(jī)交互的瓶頸,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,
甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。
正是這充斥潛力的市場前景使世界,某些著名企業(yè)無不看重“語音識(shí)別”這塊正待開發(fā)的市
場,IBM、DragonInteKMicrosoftsPhilips、MotorolaNApple、National、Nortel等大企業(yè)都
設(shè)有專門的語音識(shí)別技術(shù)研發(fā)部或子企業(yè),每年投入的研究經(jīng)費(fèi)達(dá)數(shù)千萬美元。Intel企業(yè)推
出的Pentiumlll為語音產(chǎn)品的實(shí)時(shí)化提供了深入的保證。反過來,語音產(chǎn)品的發(fā)展也將為半
導(dǎo)體工業(yè)提供新H勺契機(jī)。
在國際市場上,由于中國向國際地位與日俱增以及在經(jīng)濟(jì)和市場方面所處口勺重要地位,漢語
語音識(shí)別越來越受到重視;各大企業(yè)都相繼投入到漢語語音識(shí)別系統(tǒng)H勺開發(fā)中,其投資也在
逐年增長。
口漸火爆B勺語音市場再一次給我們帶來了機(jī)遇和挑戰(zhàn);不停涌現(xiàn)和口新月異的新產(chǎn)品將證
明,語音識(shí)別產(chǎn)品是繼、計(jì)算機(jī)、Internet之后,信息產(chǎn)業(yè)界的又一次革命。
2.2功能簡介(目的I)
本系統(tǒng)的重要功能是實(shí)現(xiàn)顧客通過語音來進(jìn)行對(duì)?系統(tǒng)的操作以及完畢對(duì)系統(tǒng)資源的控制與
使用,使我們可以用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得"。講的j通俗一點(diǎn),就是顧客“說
話”來操縱電腦,省去使用鼠標(biāo),鍵盤日勺麻煩了。
此外,還可以協(xié)助顧客“讀”文本,實(shí)現(xiàn)文本到語音口勺轉(zhuǎn)換,同樣免除顧客長期用眼看資料
的勞頓。
本產(chǎn)品實(shí)現(xiàn)了人機(jī)交互口勺功能,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,
甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。
為顧客操作windows系統(tǒng)提供一種更智能,更人性化H勺操作方式,通過語音來完畢
windows基本操作,使顧客有一種親切口勺感覺。
為顧客操作系統(tǒng)帶來一種耳目一新,以便、快捷的感受,語音的控制使顧客辦公及基
本操作抵達(dá)事半功備的效果。
愈加新奇的操作界面(語音精靈日勺加入)能使顧客在操作過程中抵達(dá)一種娛樂的效果。
2.3顧客的特點(diǎn)
該語音系統(tǒng)既可使深入理解windows基本操作時(shí)顧客操作起來愈加緊捷、以便,也可對(duì)初步
有window、操作知識(shí)的顧客深入學(xué)習(xí)電腦知識(shí)有輔助效果,使其學(xué)得更快??傮w來講本系統(tǒng)
合用的顧客范圍較廣,只要具有一點(diǎn)電腦知識(shí)的顧客都可以順利的應(yīng)用本系統(tǒng)。
2.4運(yùn)行環(huán)境
硬件環(huán)境
CPU:2.2GHZ或更快;
內(nèi)存:512MB或更大的內(nèi)存;
硬盤:7200RPM或更快H勺硬盤;
其他外設(shè):麥克風(fēng)等音頻輸入設(shè)備,耳麥等音頻輸出設(shè)備;
軟件環(huán)境
(一)操作系統(tǒng):
MicrosoftWindowsXP
MicrosoftWindowsServer2023ServicePack2
MicrosoftWindowsServer2023
(")運(yùn)行環(huán)境
1..NETFrameVi/ork3.5或更高版本。
2.對(duì)H勺安裝微軟SDK語音引擎包及微軟SDK語音引擎中口語言包。
2.5條件與限制
由于本系統(tǒng)為語音識(shí)別系統(tǒng),程序運(yùn)行時(shí)需要接受并分析判斷來自終端輸入口勺語音音頻,
因此程序運(yùn)行時(shí)對(duì)周闈環(huán)境的噌雜程度規(guī)定很高,規(guī)定周闈環(huán)境噪音越小越好,最佳是在
一種安靜的環(huán)境里:另首先,在使用我們的產(chǎn)品之前,最佳是做一種語音訓(xùn)練,以便讓計(jì)
算機(jī)更熟悉顧客口勺聲音,以便顧客口勺操作,讓顧客使用H勺更舒心,我們更放心:再次,也
規(guī)定顧客所使用口勺音頻輸入設(shè)備(麥克風(fēng))的質(zhì)量要好,也就是要保證語音識(shí)別率高。
2.6假設(shè)與依賴
本項(xiàng)目基于.NET并依賴于微軟最新語音識(shí)別引擎、SpeechAPI5.1(語音編程接口)。
三.大賽項(xiàng)目規(guī)定(功能需求)
3.1功能需求簡介
運(yùn)用既有語音引擎或獨(dú)立底層開發(fā)基于語音識(shí)別技術(shù)的Windows操作助手,助手可以
協(xié)助顧客在任何可以輸入文字的地方根據(jù)顧客語音命令輸入文字,也可以協(xié)助顧客使用語音
進(jìn)行WindowsU勺常規(guī)操作,如啟動(dòng)某某軟件,關(guān)閉目前窗口,關(guān)閉Windows,點(diǎn)擊特定按鈕
或選擇指定"勺菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(雖然得該軟件窗口獲得焦點(diǎn)),拷貝
屏幕區(qū)域,上翻或下翻目前正在瀏覽日勺網(wǎng)頁或閱讀的文章,刪除文獻(xiàn),清空文獻(xiàn)垃圾桶等。
助手在協(xié)助顧客進(jìn)行多種慳作時(shí)要在屏幕上明顯體現(xiàn)出該操作是助手協(xié)助完畢的,以區(qū)別于
顧客通過鼠標(biāo)或鍵盤進(jìn)行的其他操作。要保證在不需要助手的J時(shí)候,它會(huì)安靜日勺呆在一邊,
不能影響顧客H勺正常操作。賽題中波及的重要技術(shù)難點(diǎn)有兩個(gè),語音識(shí)別及屏幕取詞,本產(chǎn)
品都已經(jīng)突破。
此語音系統(tǒng)日勺重要功能是通過語音輸入、識(shí)別來實(shí)現(xiàn)最終的語音控制,其中語音識(shí)別子系統(tǒng)
中又有語音訓(xùn)練向?qū)?、麥克風(fēng)設(shè)置向?qū)А⒆远x詞庫、發(fā)音敏捷度設(shè)置等設(shè)置功能;此外,
文本朗誦,語音精靈是本系統(tǒng)H勺輔助功能;對(duì)本系統(tǒng)的功能簡介我們將在功能概要設(shè)計(jì)闡明
及細(xì)節(jié)闡明中給出詳細(xì)的闡明,下面通過一種形象的實(shí)例簡介系系統(tǒng)所提供的服務(wù)。
3.2功能需求實(shí)例圖
3.2功能需求流程圖
P1.4Pl.1
音
系
語
統(tǒng)語音識(shí)別
設(shè)
置
功能模塊
麥
發(fā)
用
語
音
克
戶
自P1.5
音
靈
風(fēng)
自
定漢字字庫
訓(xùn)
敏
設(shè)
定
義查詢
練
度
詞
置
義
向
庫
設(shè)
向
命
導(dǎo)
置
導(dǎo)
令
在找命令庫療找命令庫療找命令庫Af找命令岸
文件,執(zhí)行文件,執(zhí)行文件,執(zhí)行文件,執(zhí)行
操作操作操作操作
3.2功能一一一語音識(shí)別與輸入
3.2.1功能闡明
此功能應(yīng)當(dāng)是本系統(tǒng)實(shí)現(xiàn)主功能日勺基礎(chǔ)重要功能,優(yōu)先級(jí)高。
3.2.2功能描述
規(guī)定系統(tǒng)可以精確識(shí)別顧客通過終端輸入的語音,在任何可以輸入文字日勺地方根據(jù)顧客語
音命令輸入文字,并也可以協(xié)助顧客使用語音進(jìn)行眄ndows的常規(guī)操作(波及語音控制)。
語音識(shí)別是大賽規(guī)定中提到的技術(shù)難點(diǎn)之一。
顧客對(duì)著麥克風(fēng)說話,實(shí)現(xiàn)和計(jì)算機(jī)口勺互動(dòng),實(shí)際上是我們的產(chǎn)品接受了顧客說的內(nèi)容,
然后把聲音轉(zhuǎn)換為文字,在命令模式卜,實(shí)現(xiàn)了顧客說什么計(jì)算機(jī)則會(huì)根據(jù)顧客所說的命
令執(zhí)行對(duì)應(yīng)的操作。當(dāng)顧客的命令計(jì)算機(jī)不存在或顧客說的不精確時(shí),我們H勺精靈則會(huì)提
醒顧客沒有該命令,或說的命令不精確提醒顧客請(qǐng)?jiān)僬f一遍。在輸入模式下,實(shí)現(xiàn)了完全
取代鍵盤和鼠標(biāo)H勺操作,使顧客不用再運(yùn)用鼠標(biāo)和鍵盤向計(jì)算機(jī)傳播輸入H勺信息文字,在
此模式卜,顧客說什么,計(jì)算機(jī)就會(huì)“寫”什么。同步,輸入模式和命令模式可以互相轉(zhuǎn)
換。
3.3功能二——屏幕取詞
331功能闡明
屏幕取詞功能同樣是實(shí)現(xiàn)主控制功能口勺重要基礎(chǔ)功能,是實(shí)現(xiàn)語音識(shí)別日勺重要基石之一。
其優(yōu)先級(jí)別也較高。
3.3.2功能描述
通過此功能可以獲得桌面,系統(tǒng)窗體,以及任務(wù)欄、選項(xiàng)卡、標(biāo)簽等其內(nèi)部日勺任何文本,
在命令模式下,根據(jù)顧客說出歐I命令,在打開的窗體中進(jìn)行“查找”和“匹配”,在模糊匹
配的協(xié)助下,找到顧客說出的命令然后執(zhí)行對(duì)應(yīng)的操作。此功能在描述上簡樸,不過實(shí)現(xiàn)
上將是?種難點(diǎn),屏幕取詞同樣也是大賽規(guī)定中提到日勺技術(shù)難點(diǎn)之二。
3.4功能三一一語音
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高一化學(xué)離子推斷題目及答案
- 心理健康知識(shí)競賽題庫
- 當(dāng)代中國社會(huì)消費(fèi)心理和行為
- 外墻施工現(xiàn)場安全防護(hù)方案
- 燃?xì)夤こ淌┕f(xié)調(diào)溝通方案
- 2026年及未來5年市場數(shù)據(jù)中國銅母線行業(yè)市場全景分析及投資規(guī)劃建議報(bào)告
- 旅游景區(qū)游步道建設(shè)方案
- 施工現(xiàn)場聲學(xué)環(huán)境治理方案
- 濃鹽水分鹽及資源化利用改造項(xiàng)目節(jié)能評(píng)估報(bào)告
- 道路側(cè)坡及邊溝整治技術(shù)方案
- 2026年齊齊哈爾高等師范專科學(xué)校單招職業(yè)適應(yīng)性測試題庫必考題
- 安徽省六校2026年元月高三素質(zhì)檢測考試物理試題(含答案)
- 2025年西南醫(yī)科大學(xué)馬克思主義基本原理概論期末考試真題匯編
- (2025版)肥胖癥合并骨關(guān)節(jié)炎專家共識(shí)課件
- T-SUCCA 01-2025 二手摩托車鑒定評(píng)估技術(shù)規(guī)范
- 2025山西焦煤集團(tuán)所屬華晉焦煤井下操作技能崗?fù)艘圮娙苏衅?0人筆試試題附答案解析
- 2026年南京交通職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫及答案詳解一套
- 2型糖尿病臨床路徑標(biāo)準(zhǔn)實(shí)施方案
- 2025年醫(yī)療人工智能產(chǎn)業(yè)報(bào)告-蛋殼研究院
- 長沙股權(quán)激勵(lì)協(xié)議書
- 問卷星使用培訓(xùn)
評(píng)論
0/150
提交評(píng)論