軟件需求規(guī)范_第1頁
軟件需求規(guī)范_第2頁
軟件需求規(guī)范_第3頁
軟件需求規(guī)范_第4頁
軟件需求規(guī)范_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Windows語音助手

軟件需求闡明書

文檔編號(hào):D01

版本號(hào):VI.1

編寫:—編寫日期:

校對(duì):校對(duì)U期:

FirstDreamTeam團(tuán)體開發(fā)人員

開發(fā)單位:青島大學(xué)——FirstDreamTeam團(tuán)體

項(xiàng)目負(fù)責(zé)人:

令文檔修改記錄

修改人修改時(shí)間版本號(hào)備注

*1*2023-6-20VI.0初次編寫

*JXKW

*T**T**T*2023-6-30VI.1調(diào)整需求,重點(diǎn)強(qiáng)調(diào)項(xiàng)目功能需求

?X**1*

4、*T*■卜*7*2023-7-10VI.3細(xì)化需求,重新調(diào)整文檔構(gòu)造。

S*x

*1**1*2023-8-1V1.4統(tǒng)一文檔構(gòu)造。

3.2功能需求實(shí)例圖..............................................錯(cuò)誤!未定義書簽。

3.2功能需求流程圖..............................................錯(cuò)誤!未定義書簽。

3.2功能------語音識(shí)別與輸入..................................錯(cuò)誤!未定義書簽。

功能闡明......................................................錯(cuò)誤!未定義書簽。

功能描述......................................................錯(cuò)誤!未定義書簽。

3.3功能二一一屏幕取詞..........................................錯(cuò)誤!未定義書簽。

功能闡明......................................................錯(cuò)誤!未定義書簽。

功能描述......................................................錯(cuò)誤!未定義書簽。

3.4功能二——語音?控制..........................................錯(cuò)誤!未定義書簽。

功能闡明......................................................錯(cuò)誤!未定義書簽。

功能描述......................................................錯(cuò)誤!未定義書簽。

3.5功能四一一語音精靈..........................................錯(cuò)誤!未定義書簽。

功能闡明......................................................錯(cuò)誤!未定義書簽。

功能描述......................................................錯(cuò)誤!未定義書簽。

3.6功能五一一語音朗誦(TTS)........................................................................錯(cuò)誤!未定義書簽。

功能闡明......................................................錯(cuò)誤!未定義書簽。

功能描述......................................................錯(cuò)誤!未定義書簽。

四.運(yùn)行規(guī)定....................................................錯(cuò)誤!未定義書簽。

4.1顧客界面..................................................錯(cuò)誤!未定義書簽。

4.2硬件接口..................................................錯(cuò)誤!未定義書簽。

4.3軟件接口..................................................錯(cuò)誤!未定義書簽。

4.4通信接口(無)...........................................錯(cuò)誤!未定義書簽。

一.引言

1.1編寫目的

該文檔對(duì)所開發(fā)的Windows語音助手抵達(dá)功能、性能、顧客界面及運(yùn)行環(huán)境

等作出了詳細(xì)的闡明。他作為對(duì)該系統(tǒng)概要設(shè)計(jì)口勺根據(jù),協(xié)助開發(fā)人員理解本系統(tǒng)

R勺框架思想及實(shí)現(xiàn)功能,并驗(yàn)證核算該產(chǎn)品能否滿足顧客規(guī)定的原則,便于技術(shù)文

檔和需求變化的管理。同步也是顧客與開發(fā)人員雙方對(duì)軟件需求獲得共同理解的

基礎(chǔ)。

預(yù)期讀者:大賽評(píng)委、項(xiàng)目投資商、產(chǎn)品顧客、開發(fā)人員,指導(dǎo)老師.

1.2項(xiàng)目背景

■系統(tǒng)名稱:Windows語音助手

?任務(wù)提出者:

■開發(fā)者:青島大學(xué)FirstDreamTeam團(tuán)體。

■面向顧客:

1、但愿可以借助語音系統(tǒng)愈加緊捷、以便日勺操作電腦的顧客。

2、無法很好運(yùn)用鼠標(biāo)或鍵盤對(duì)電腦進(jìn)行操作日勺殘障人士顧客。

?特此申明:此軟件口勺開發(fā)作為后期商業(yè)項(xiàng)目的原型,均采用授權(quán)開發(fā)工具,產(chǎn)品

擁有自主知識(shí)產(chǎn)權(quán),未經(jīng)容許不得隨意傳播或使用。

1.3定義

,SDK:SDK就是SoftwareDevelopmentKitH勺縮寫,中文意思就是

“軟件開發(fā)工具包”。這是一種覆蓋面相稱廣泛的名詞,可以這樣說:輔助開

發(fā)某一類軟件的有關(guān)文檔、范例和工具的集合都可以叫做“SDK”。

■TTS

全稱為:TextToSpeech即文本合成語音,此為SAPI的基本類型之一,

TTS可以將文本中的)字符或文檔合成為語音并“說"出來。

■SR

全拼:SpeechRecognise即語音識(shí)別,此也為SAPI的基本類型之二,

SR則可以把人說話H勺語音轉(zhuǎn)換為易讀H勺字符或文檔。

?SAPI

SAPI又稱語音應(yīng)用程序編程接口,它減少了語音識(shí)別和語音合成應(yīng)用

中的程序代碼,使得語音技術(shù)在廣泛和蓬勃發(fā)展的實(shí)際應(yīng)用中更輕易使

用。SAPI使得應(yīng)用程序和語音引擎之間高度緊密的結(jié)合。SAPI可以實(shí)

時(shí)處理多種語音引擎在底層工作中口勺細(xì)節(jié)。

SAPI包括文本合成語音應(yīng)用程序接II,語音識(shí)別應(yīng)用程序接口。

SAPI日勺兩種基本類型是文本合成語音(TTS)引擎和語音識(shí)別

(SR)引擎。

WindowsAPI(Win32API)

WindowsAPI是一套用來控制Windows曰勺各個(gè)部件(從桌面的外觀到為

一種新進(jìn)程分派的內(nèi)存)的外觀和行為的一套預(yù)先定義的Windows函數(shù).顧客

日勺每個(gè)動(dòng)作都會(huì)引起?種或幾種函數(shù)的I運(yùn)行以告訴Windows發(fā)生了什么.

API函數(shù)包括在Windows系統(tǒng)目錄下日勺動(dòng)態(tài)連接庫文獻(xiàn)中(如

User32.dll;GDI32.dll,Shell32.dll...).

1.4參照資料

1.大賽題目設(shè)置《Windows語音助手》的有關(guān)詳細(xì)規(guī)定。

2.參照書籍:

?!墩Z音識(shí)別與控制應(yīng)用技術(shù)》

劉幺和,宋庭新編著

出版社:科學(xué)出版社

出版時(shí)間:2023-2-1

令《新編API大全》2023版

?MicrosoftMSDN

?MicrosoftSpeechSDK5.1Help

<《C#開發(fā)技巧大全》中國水利出版社

?《C#數(shù)據(jù)安全手冊(cè)》人民郵電出版社

?《C#高級(jí)編程》-清華大學(xué)出版社

?《國標(biāo)軟件產(chǎn)品需求規(guī)格闡明書》

?《國標(biāo)可行性分析匯報(bào)》

?《軟件工程》

作者:曾建潮

ISBN:

出版社:武漢工大

出版日期:2023-5-1

?《軟件工程與軟件文檔寫作》

作者:文斌,劉長青,田原編著

ISBN:2,

出版社:清華大學(xué)出版社

出版日期:2023-8-1

?《軟件需求工程》

作者黃國興周勇

出版社清華大學(xué)出版社

書號(hào)302-16860-7

出版時(shí)間2023年4月字?jǐn)?shù)千字

二.任務(wù)概述

項(xiàng)目最終采用最新微軟.NET技術(shù),并結(jié)合微軟最新語音識(shí)別引擎,通過語音輸

入抵達(dá)對(duì)計(jì)算機(jī)日勺基本控制。本項(xiàng)目在VisualStudio2023集成開發(fā)環(huán)境下開發(fā),

基于.NET及Speech語音引擎平臺(tái)。給客戶帶來以便快捷的全新體驗(yàn)。

2.1語音識(shí)別技術(shù)的來源與發(fā)展前景

語音識(shí)別技術(shù)簡介

智能翻譯機(jī)、語音撥號(hào)、語音查詢、語音自動(dòng)定票系統(tǒng)、語音工業(yè)控制等等,可以想見,凡

用計(jì)算機(jī)的地方都會(huì)有語音識(shí)別。在計(jì)算機(jī)輔助教育方面,計(jì)算機(jī)就成為專業(yè)的家庭輔導(dǎo)教

師;在幼兒進(jìn)行啟蒙教育的玩具中,語音識(shí)別也將倍受歡迎。

電腦語音合成技術(shù)即CTI(ComputerTelephoneIntegration),是用計(jì)算機(jī)技術(shù)處理語音。

一般是建一種信息呼喊中心,顧客打來時(shí)計(jì)算機(jī)會(huì)自動(dòng)地一層層地轉(zhuǎn)給有關(guān)部門,一直

到為顧客處理問題為止。有口勺語音信箱可以支持不同樣語種。CTI并非新技術(shù)。與網(wǎng)絡(luò)把

數(shù)據(jù)壓縮打包進(jìn)行傳播有所不同樣,CTI究竟還是一種語音模擬傳播技術(shù),只不過用上了計(jì)

算機(jī)對(duì)語音進(jìn)行智能管理而己。發(fā)達(dá)國家早幾年就普及了這項(xiàng)應(yīng)用,”是個(gè)機(jī)構(gòu)就有呼喊中

心”,以保證客戶或合作伙伴打來的I每一種均有回應(yīng)。中國卻還沒有走到這一步,目前除

了電信部門普遍開通了“呼喊中心”服務(wù)之外,大多數(shù)企業(yè)還剛剛起步。這個(gè)差距反應(yīng)了管

理和競爭意識(shí)方面口勺問題,

中文語音瀏覽器產(chǎn)品“Interversa”使我們可以用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。

Interversa已針對(duì)PentiumllllftSSE指令集進(jìn)行了優(yōu)化,井將在PentiumHI上實(shí)現(xiàn)最佳佐性能

和識(shí)別率。

常見時(shí)語音識(shí)別系統(tǒng)尚有“命令和控制(Command&Control)”(是持續(xù)的,擁有小詞匯量和

獨(dú)立揚(yáng)聲器)、“語音導(dǎo)航”、微軟的“不持續(xù)聽寫(DiscreteDictation)”(是不持續(xù)、大詞匯

量和非獨(dú)立揚(yáng)聲器的J),IBM的ViaVoice則屬于持續(xù)聽寫。

語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)閷?duì)應(yīng)的文本或命

令的高技術(shù),也就是讓機(jī)器聽懂人類的語音。也就是說,假如電腦配置有“語音辨識(shí)”的程

序組,那么當(dāng)你的聲音通過一種轉(zhuǎn)換裝置輸入電腦內(nèi)部、并以數(shù)位方式儲(chǔ)存后,語音辨識(shí)程

療便開始以你輸入的聲音樣本與事先儲(chǔ)存好的聲音樣本進(jìn)行對(duì)比工作。聲音對(duì)比工作完畢之

后,電腦就會(huì)輸入一種它認(rèn)為最“象”的聲音樣本序號(hào),就可以懂得你剛剛念的聲音是什么

意義,進(jìn)而執(zhí)行此命令。說起來簡樸,但要真正建立辨識(shí)率高的語音辨識(shí)程序組,卻是非常

困難而專業(yè)的b世界各地肉學(xué)者們也還在努力研究最佳的方式。專家學(xué)者們研究出許多破解

這個(gè)問題的I措施,如傅立葉轉(zhuǎn)換、倒頻譜參數(shù)等,使目前的語音辨識(shí)系統(tǒng)已抵達(dá)一種可接受

的程度,并且辨識(shí)度愈來愈高。

本項(xiàng)目是一種基于語音識(shí)別口勺i種智能化服務(wù)產(chǎn)品,是面向服務(wù)設(shè)計(jì)的成功案例之一。

語音識(shí)別技術(shù)的應(yīng)用

語音識(shí)別技術(shù)的應(yīng)用重要有如下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲

很高,由于使用鍵盤、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,尤其是不

懂英語或不熟悉漢語拼?&的人被拒之于門外,影響到電子計(jì)算機(jī)的深入普及。語音識(shí)別技術(shù)

時(shí)采用,變化了人與計(jì)算機(jī)的互動(dòng)模式,人們只需動(dòng)動(dòng)口,就能打開或關(guān)閉程序,變化工作界

面。這種使電腦人性化的成果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。

仍是目前使用最為普遍的通信工具,通過與語音識(shí)別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語音撥

號(hào)、購物以及通過辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。很快,能按

主人口令接通、打開收音機(jī),以及通過聲紋識(shí)別來者身份的安全系統(tǒng)也將獲得應(yīng)用。

語音識(shí)別技術(shù)的另首先應(yīng)用便是語音輸入和合成語音輸出。目前,已經(jīng)出現(xiàn)能將口述的

文稿輸入計(jì)算機(jī)并按指定格式編排U勺語音軟件,它比通過鍵盤輸入在速度上要提高2?4倍。

裝有語■&軟件的電腦還能通過語音合成把計(jì)算機(jī)里"勺文獻(xiàn)用多種語言“讀”出來,這將大大

推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)的發(fā)展。

在現(xiàn)階段,語音技術(shù)重要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對(duì)于節(jié)省人力、

時(shí)間,提高工作效率將起到明顯的作用。能實(shí)現(xiàn)自動(dòng)翻譯H勺語音識(shí)別系統(tǒng)目前也正在研究、

完善之中。

語音識(shí)別技術(shù)的發(fā)展

語音識(shí)別技術(shù)是2023年至2023年間信息技術(shù)領(lǐng)域十大重要II勺科技發(fā)展技術(shù)之一。它是一

門交叉學(xué)科,正逐漸成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)。語音識(shí)別技術(shù)與語音合成技術(shù)結(jié)

合使人們可以甩掉鍵盤,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一種具有競爭性

的新興高技術(shù)產(chǎn)業(yè)。

與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢(mèng)寐以求的事情。語音識(shí)別

技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)閷?duì)應(yīng)的文本或命令的高技術(shù)。語音識(shí)

別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)獲得明顯進(jìn)步,開始從試驗(yàn)室走向市場。人

們估計(jì),未來23年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服

務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。

語音識(shí)別聽寫機(jī)在某些領(lǐng)域的應(yīng)用被美國新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。諸

多專家都認(rèn)為語音識(shí)別技術(shù)是2023年至2023年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)

之一。

語音識(shí)別產(chǎn)品將是繼、計(jì)算機(jī)、Internet之后信息產(chǎn)業(yè)界口勺又一次革命。

假如我們可以突破人機(jī)交互的瓶頸,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,

甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。

正是這充斥潛力的市場前景使世界,某些著名企業(yè)無不看重“語音識(shí)別”這塊正待開發(fā)的市

場,IBM、DragonInteKMicrosoftsPhilips、MotorolaNApple、National、Nortel等大企業(yè)都

設(shè)有專門的語音識(shí)別技術(shù)研發(fā)部或子企業(yè),每年投入的研究經(jīng)費(fèi)達(dá)數(shù)千萬美元。Intel企業(yè)推

出的Pentiumlll為語音產(chǎn)品的實(shí)時(shí)化提供了深入的保證。反過來,語音產(chǎn)品的發(fā)展也將為半

導(dǎo)體工業(yè)提供新H勺契機(jī)。

在國際市場上,由于中國向國際地位與日俱增以及在經(jīng)濟(jì)和市場方面所處口勺重要地位,漢語

語音識(shí)別越來越受到重視;各大企業(yè)都相繼投入到漢語語音識(shí)別系統(tǒng)H勺開發(fā)中,其投資也在

逐年增長。

口漸火爆B勺語音市場再一次給我們帶來了機(jī)遇和挑戰(zhàn);不停涌現(xiàn)和口新月異的新產(chǎn)品將證

明,語音識(shí)別產(chǎn)品是繼、計(jì)算機(jī)、Internet之后,信息產(chǎn)業(yè)界的又一次革命。

2.2功能簡介(目的I)

本系統(tǒng)的重要功能是實(shí)現(xiàn)顧客通過語音來進(jìn)行對(duì)?系統(tǒng)的操作以及完畢對(duì)系統(tǒng)資源的控制與

使用,使我們可以用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得"。講的j通俗一點(diǎn),就是顧客“說

話”來操縱電腦,省去使用鼠標(biāo),鍵盤日勺麻煩了。

此外,還可以協(xié)助顧客“讀”文本,實(shí)現(xiàn)文本到語音口勺轉(zhuǎn)換,同樣免除顧客長期用眼看資料

的勞頓。

本產(chǎn)品實(shí)現(xiàn)了人機(jī)交互口勺功能,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,

甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。

為顧客操作windows系統(tǒng)提供一種更智能,更人性化H勺操作方式,通過語音來完畢

windows基本操作,使顧客有一種親切口勺感覺。

為顧客操作系統(tǒng)帶來一種耳目一新,以便、快捷的感受,語音的控制使顧客辦公及基

本操作抵達(dá)事半功備的效果。

愈加新奇的操作界面(語音精靈日勺加入)能使顧客在操作過程中抵達(dá)一種娛樂的效果。

2.3顧客的特點(diǎn)

該語音系統(tǒng)既可使深入理解windows基本操作時(shí)顧客操作起來愈加緊捷、以便,也可對(duì)初步

有window、操作知識(shí)的顧客深入學(xué)習(xí)電腦知識(shí)有輔助效果,使其學(xué)得更快??傮w來講本系統(tǒng)

合用的顧客范圍較廣,只要具有一點(diǎn)電腦知識(shí)的顧客都可以順利的應(yīng)用本系統(tǒng)。

2.4運(yùn)行環(huán)境

硬件環(huán)境

CPU:2.2GHZ或更快;

內(nèi)存:512MB或更大的內(nèi)存;

硬盤:7200RPM或更快H勺硬盤;

其他外設(shè):麥克風(fēng)等音頻輸入設(shè)備,耳麥等音頻輸出設(shè)備;

軟件環(huán)境

(一)操作系統(tǒng):

MicrosoftWindowsXP

MicrosoftWindowsServer2023ServicePack2

MicrosoftWindowsServer2023

(")運(yùn)行環(huán)境

1..NETFrameVi/ork3.5或更高版本。

2.對(duì)H勺安裝微軟SDK語音引擎包及微軟SDK語音引擎中口語言包。

2.5條件與限制

由于本系統(tǒng)為語音識(shí)別系統(tǒng),程序運(yùn)行時(shí)需要接受并分析判斷來自終端輸入口勺語音音頻,

因此程序運(yùn)行時(shí)對(duì)周闈環(huán)境的噌雜程度規(guī)定很高,規(guī)定周闈環(huán)境噪音越小越好,最佳是在

一種安靜的環(huán)境里:另首先,在使用我們的產(chǎn)品之前,最佳是做一種語音訓(xùn)練,以便讓計(jì)

算機(jī)更熟悉顧客口勺聲音,以便顧客口勺操作,讓顧客使用H勺更舒心,我們更放心:再次,也

規(guī)定顧客所使用口勺音頻輸入設(shè)備(麥克風(fēng))的質(zhì)量要好,也就是要保證語音識(shí)別率高。

2.6假設(shè)與依賴

本項(xiàng)目基于.NET并依賴于微軟最新語音識(shí)別引擎、SpeechAPI5.1(語音編程接口)。

三.大賽項(xiàng)目規(guī)定(功能需求)

3.1功能需求簡介

運(yùn)用既有語音引擎或獨(dú)立底層開發(fā)基于語音識(shí)別技術(shù)的Windows操作助手,助手可以

協(xié)助顧客在任何可以輸入文字的地方根據(jù)顧客語音命令輸入文字,也可以協(xié)助顧客使用語音

進(jìn)行WindowsU勺常規(guī)操作,如啟動(dòng)某某軟件,關(guān)閉目前窗口,關(guān)閉Windows,點(diǎn)擊特定按鈕

或選擇指定"勺菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(雖然得該軟件窗口獲得焦點(diǎn)),拷貝

屏幕區(qū)域,上翻或下翻目前正在瀏覽日勺網(wǎng)頁或閱讀的文章,刪除文獻(xiàn),清空文獻(xiàn)垃圾桶等。

助手在協(xié)助顧客進(jìn)行多種慳作時(shí)要在屏幕上明顯體現(xiàn)出該操作是助手協(xié)助完畢的,以區(qū)別于

顧客通過鼠標(biāo)或鍵盤進(jìn)行的其他操作。要保證在不需要助手的J時(shí)候,它會(huì)安靜日勺呆在一邊,

不能影響顧客H勺正常操作。賽題中波及的重要技術(shù)難點(diǎn)有兩個(gè),語音識(shí)別及屏幕取詞,本產(chǎn)

品都已經(jīng)突破。

此語音系統(tǒng)日勺重要功能是通過語音輸入、識(shí)別來實(shí)現(xiàn)最終的語音控制,其中語音識(shí)別子系統(tǒng)

中又有語音訓(xùn)練向?qū)?、麥克風(fēng)設(shè)置向?qū)А⒆远x詞庫、發(fā)音敏捷度設(shè)置等設(shè)置功能;此外,

文本朗誦,語音精靈是本系統(tǒng)H勺輔助功能;對(duì)本系統(tǒng)的功能簡介我們將在功能概要設(shè)計(jì)闡明

及細(xì)節(jié)闡明中給出詳細(xì)的闡明,下面通過一種形象的實(shí)例簡介系系統(tǒng)所提供的服務(wù)。

3.2功能需求實(shí)例圖

3.2功能需求流程圖

P1.4Pl.1

統(tǒng)語音識(shí)別

設(shè)

功能模塊

發(fā)

自P1.5

風(fēng)

定漢字字庫

訓(xùn)

設(shè)

義查詢

設(shè)

導(dǎo)

導(dǎo)

在找命令庫療找命令庫療找命令庫Af找命令岸

文件,執(zhí)行文件,執(zhí)行文件,執(zhí)行文件,執(zhí)行

操作操作操作操作

3.2功能一一一語音識(shí)別與輸入

3.2.1功能闡明

此功能應(yīng)當(dāng)是本系統(tǒng)實(shí)現(xiàn)主功能日勺基礎(chǔ)重要功能,優(yōu)先級(jí)高。

3.2.2功能描述

規(guī)定系統(tǒng)可以精確識(shí)別顧客通過終端輸入的語音,在任何可以輸入文字日勺地方根據(jù)顧客語

音命令輸入文字,并也可以協(xié)助顧客使用語音進(jìn)行眄ndows的常規(guī)操作(波及語音控制)。

語音識(shí)別是大賽規(guī)定中提到的技術(shù)難點(diǎn)之一。

顧客對(duì)著麥克風(fēng)說話,實(shí)現(xiàn)和計(jì)算機(jī)口勺互動(dòng),實(shí)際上是我們的產(chǎn)品接受了顧客說的內(nèi)容,

然后把聲音轉(zhuǎn)換為文字,在命令模式卜,實(shí)現(xiàn)了顧客說什么計(jì)算機(jī)則會(huì)根據(jù)顧客所說的命

令執(zhí)行對(duì)應(yīng)的操作。當(dāng)顧客的命令計(jì)算機(jī)不存在或顧客說的不精確時(shí),我們H勺精靈則會(huì)提

醒顧客沒有該命令,或說的命令不精確提醒顧客請(qǐng)?jiān)僬f一遍。在輸入模式下,實(shí)現(xiàn)了完全

取代鍵盤和鼠標(biāo)H勺操作,使顧客不用再運(yùn)用鼠標(biāo)和鍵盤向計(jì)算機(jī)傳播輸入H勺信息文字,在

此模式卜,顧客說什么,計(jì)算機(jī)就會(huì)“寫”什么。同步,輸入模式和命令模式可以互相轉(zhuǎn)

換。

3.3功能二——屏幕取詞

331功能闡明

屏幕取詞功能同樣是實(shí)現(xiàn)主控制功能口勺重要基礎(chǔ)功能,是實(shí)現(xiàn)語音識(shí)別日勺重要基石之一。

其優(yōu)先級(jí)別也較高。

3.3.2功能描述

通過此功能可以獲得桌面,系統(tǒng)窗體,以及任務(wù)欄、選項(xiàng)卡、標(biāo)簽等其內(nèi)部日勺任何文本,

在命令模式下,根據(jù)顧客說出歐I命令,在打開的窗體中進(jìn)行“查找”和“匹配”,在模糊匹

配的協(xié)助下,找到顧客說出的命令然后執(zhí)行對(duì)應(yīng)的操作。此功能在描述上簡樸,不過實(shí)現(xiàn)

上將是?種難點(diǎn),屏幕取詞同樣也是大賽規(guī)定中提到日勺技術(shù)難點(diǎn)之二。

3.4功能三一一語音

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論