人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目用戶需求書_第1頁(yè)
人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目用戶需求書_第2頁(yè)
人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目用戶需求書_第3頁(yè)
人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目用戶需求書_第4頁(yè)
人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目用戶需求書_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1圍繞XX省人大數(shù)字化改革“全面貫通、整合提升、實(shí)戰(zhàn)實(shí)效”的總體要求,聚焦人大一體化公共數(shù)據(jù)平臺(tái)建設(shè),XX省人大先后赴寧波、溫州、衢州、金華等地開展實(shí)地調(diào)研,線上與杭州、嘉興、紹興等地進(jìn)行互動(dòng)交流,全面了解各地人大數(shù)據(jù)倉(cāng)建設(shè)情況,客觀總結(jié)近年來(lái)人大公共數(shù)據(jù)平臺(tái)建設(shè)的經(jīng)驗(yàn)做法、階段性成效,查找分析探索實(shí)踐中的短板弱項(xiàng),就人工智能時(shí)代背景下推動(dòng)全省人大一體化智能化數(shù)據(jù)平臺(tái)建設(shè)項(xiàng)目提出以下建設(shè)需求:(一)數(shù)據(jù)需求分析通過(guò)對(duì)立法工作、監(jiān)督工作、代表工作等人大重點(diǎn)領(lǐng)域開展深入調(diào)研,系統(tǒng)梳理現(xiàn)有業(yè)務(wù)數(shù)據(jù)資源,包括法規(guī)政策文件(包含法律法規(guī)庫(kù)、規(guī)章庫(kù)、黨內(nèi)法規(guī)庫(kù)、中央重要文件庫(kù)、國(guó)務(wù)院政策文件庫(kù)以及XX省規(guī)范性文件庫(kù))、代表履職綜合數(shù)據(jù)(含代表議案建議庫(kù)和代表風(fēng)采信息庫(kù))、基層單元應(yīng)用數(shù)據(jù)(意見(jiàn)征集函以及市縣鄉(xiāng)議案建議)、機(jī)關(guān)綜合智治數(shù)據(jù)(內(nèi)部發(fā)布系統(tǒng)文件、公文信息以及會(huì)議文件)及網(wǎng)站信息(全國(guó)人大網(wǎng)站、XX人大網(wǎng)站、XX人大雜志網(wǎng)、市縣人大網(wǎng)、兄弟省市人大網(wǎng)站以及今日之江網(wǎng)等)和市縣人大相關(guān)業(yè)務(wù)數(shù)據(jù)等,明確需歸集和治理的數(shù)據(jù)類型。在此基礎(chǔ)上,結(jié)合實(shí)際業(yè)務(wù)場(chǎng)景,科學(xué)確定數(shù)據(jù)的維度、指標(biāo)及關(guān)聯(lián)關(guān)系,形成完整的數(shù)據(jù)需求清單和維度指標(biāo)體系,明確各類數(shù)據(jù)的應(yīng)用場(chǎng)景與使用目標(biāo)。能夠直觀展示人大不同業(yè)務(wù)領(lǐng)域數(shù)據(jù)需求的提出、歸集任務(wù)的發(fā)布、數(shù)據(jù)歸集過(guò)程以及歸集情況的查看。該成果將作為后續(xù)模型設(shè)計(jì)、AI助手、數(shù)據(jù)采集與處理的依據(jù),為人大機(jī)關(guān)的業(yè)務(wù)應(yīng)用和智能化工具提供標(biāo)準(zhǔn)化、體系化的數(shù)據(jù)支撐。2(二)離散數(shù)據(jù)加載針對(duì)尚未納入現(xiàn)有業(yè)務(wù)系統(tǒng)的人大領(lǐng)域離散數(shù)據(jù),設(shè)計(jì)并提供規(guī)范化、易用的業(yè)務(wù)表單工具,確保數(shù)據(jù)錄入過(guò)程便捷、標(biāo)準(zhǔn)且符合業(yè)務(wù)要求。通過(guò)統(tǒng)一的數(shù)據(jù)采集流程,將分散的業(yè)務(wù)數(shù)據(jù)有效整合,建立可追溯、可管理的數(shù)據(jù)記錄,保證數(shù)據(jù)的完整性與準(zhǔn)確性。在此基礎(chǔ)上,形成離散數(shù)據(jù)匯集清單和結(jié)構(gòu)化存儲(chǔ)結(jié)果,為后續(xù)的數(shù)據(jù)治理與分析建模提供堅(jiān)實(shí)基礎(chǔ)。(三)網(wǎng)站數(shù)據(jù)抓取通過(guò)網(wǎng)絡(luò)爬取技術(shù),對(duì)全國(guó)人大、XX人大及相關(guān)雜志網(wǎng)、兄弟省市人大網(wǎng)站重點(diǎn)欄目、今日XX網(wǎng)等公開渠道的信息資源進(jìn)行自動(dòng)采集與存儲(chǔ)。結(jié)合數(shù)據(jù)清洗和規(guī)范化處理,對(duì)采集內(nèi)容進(jìn)行去重、格式統(tǒng)一與完整性校驗(yàn),確保數(shù)據(jù)質(zhì)量、準(zhǔn)確性與一致性,形成高質(zhì)量的數(shù)據(jù)基礎(chǔ),為后續(xù)的數(shù)據(jù)治理、建模與分析提供有力支撐。(四)數(shù)據(jù)采集和預(yù)處理從各類業(yè)務(wù)系統(tǒng)及離散數(shù)據(jù)源中高效提取人大相關(guān)業(yè)務(wù)數(shù)據(jù),建立統(tǒng)一的數(shù)據(jù)采集機(jī)制。結(jié)合數(shù)據(jù)清洗、缺失值補(bǔ)全、重復(fù)值剔除、格式規(guī)范化等處理手段,提升數(shù)據(jù)的完整性、準(zhǔn)確性與一致性。通過(guò)結(jié)構(gòu)統(tǒng)一的數(shù)據(jù)集,為后續(xù)的數(shù)據(jù)建模與分析應(yīng)用提供可靠支撐。(五)數(shù)據(jù)分析建模根據(jù)人大各業(yè)務(wù)場(chǎng)景的實(shí)際需求,設(shè)計(jì)并構(gòu)建立法全生命周期模型、監(jiān)督全過(guò)程模型、代表全生命周期模型等核心業(yè)務(wù)模型。通過(guò)深度挖掘數(shù)據(jù)間的內(nèi)在關(guān)聯(lián)與規(guī)律,形成直觀的數(shù)據(jù)圖譜,清晰展現(xiàn)關(guān)優(yōu)化工作流程,提升運(yùn)行效率和決策支撐能力。在此基礎(chǔ)上,生成對(duì)應(yīng)的專題分析表和結(jié)果表,以標(biāo)準(zhǔn)化的方式呈現(xiàn)立法、監(jiān)督、代表等重點(diǎn)工作的運(yùn)行情況,直觀反映關(guān)鍵指標(biāo)、主要趨勢(shì)和整體分布情3況。相關(guān)成果既可作為日常業(yè)務(wù)的查詢與統(tǒng)計(jì)依據(jù),也可為研究分析和決策支持提供可靠的數(shù)據(jù)支撐,推動(dòng)人大工作更加科學(xué)化和高效化。(六)數(shù)據(jù)存儲(chǔ)和管理為基礎(chǔ)庫(kù)與專題庫(kù)設(shè)計(jì)高效的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)和索引機(jī)制,優(yōu)化數(shù)據(jù)檢索與查詢性能。建立健全的數(shù)據(jù)管理機(jī)制,包括定期數(shù)據(jù)備份、細(xì)粒度的訪問(wèn)權(quán)限控制以及動(dòng)態(tài)數(shù)據(jù)更新策略,確保數(shù)據(jù)的安全性、完整性和高可用性。同時(shí),通過(guò)規(guī)范化的管理流程,保障數(shù)據(jù)治理的長(zhǎng)期穩(wěn)定性和可持續(xù)發(fā)展。部署在服務(wù)端的智能中文實(shí)時(shí)語(yǔ)音識(shí)別轉(zhuǎn)寫引擎,實(shí)現(xiàn)對(duì)中文普通話連續(xù)語(yǔ)音的實(shí)時(shí)轉(zhuǎn)寫,提供對(duì)已轉(zhuǎn)寫文字的后處理及音字同步對(duì)齊能力,中文清晰標(biāo)準(zhǔn)普通話轉(zhuǎn)寫準(zhǔn)確率可達(dá)95%以上;增加人大場(chǎng)景定制模板,用于支撐諸如人大常委會(huì)會(huì)議、一般工作性會(huì)議等語(yǔ)音識(shí)別場(chǎng)景。智能語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫引擎需集成市面上最新版本的語(yǔ)音識(shí)別轉(zhuǎn)寫引擎和機(jī)器翻譯引擎技術(shù),支持連續(xù)語(yǔ)流數(shù)據(jù)訓(xùn)練而成的聲學(xué)模型及先進(jìn)的二遍解碼技術(shù),具備獨(dú)有文本順滑、標(biāo)點(diǎn)識(shí)別、數(shù)字后處理等自然語(yǔ)言處理能力,能夠讓識(shí)別結(jié)果更加準(zhǔn)確、規(guī)范。針對(duì)人大常委會(huì)會(huì)議、一般工作性會(huì)議需設(shè)計(jì)一款集簡(jiǎn)報(bào)出稿、會(huì)議紀(jì)要生成、數(shù)據(jù)管理為一體的產(chǎn)品,服務(wù)于人大常委會(huì)會(huì)議分組討論和一般工作性會(huì)議場(chǎng)景,主要功能需求如下。1.對(duì)接數(shù)智會(huì)議系統(tǒng)需支持與省人大數(shù)智會(huì)議系統(tǒng)對(duì)接,同步獲取各次常委會(huì)會(huì)議的日程、議程、4會(huì)議文件等信息,為后續(xù)大模型智能提煉委員審議發(fā)言提供基礎(chǔ)。2.對(duì)接省人大統(tǒng)一用戶體系需支持與省人大統(tǒng)一用戶體系對(duì)接,同步組織機(jī)構(gòu)、用戶等數(shù)據(jù)。3.對(duì)接X(jué)政釘需支持與X政釘對(duì)接,實(shí)現(xiàn)X政釘掃碼登錄。4.實(shí)時(shí)轉(zhuǎn)寫針對(duì)實(shí)時(shí)會(huì)議場(chǎng)景,需支持實(shí)時(shí)采集會(huì)議音頻并同步轉(zhuǎn)寫成文字。5.離線轉(zhuǎn)寫針對(duì)非實(shí)時(shí)會(huì)議場(chǎng)景,需支持上傳錄制好的會(huì)議音頻文件并同步轉(zhuǎn)寫成文字。6.手動(dòng)錄入針對(duì)無(wú)音頻文件場(chǎng)景,需支持手動(dòng)錄入不同發(fā)言人的審議發(fā)言內(nèi)容。7.語(yǔ)篇規(guī)整需支持與省人大垂域大模型對(duì)接,調(diào)用其開放接口實(shí)現(xiàn)借助大語(yǔ)言模型對(duì)參會(huì)人員發(fā)言內(nèi)容進(jìn)行語(yǔ)篇規(guī)整的能力。需支持對(duì)原始發(fā)言和規(guī)整后發(fā)言的比對(duì)功8.說(shuō)話人區(qū)分需支持根據(jù)音頻文件對(duì)說(shuō)話人進(jìn)行區(qū)分的能力,將音頻轉(zhuǎn)寫后的內(nèi)容按照不9.AI智能提煉審議發(fā)言需支持與省人大垂域大模型對(duì)接,調(diào)用其開放接口實(shí)現(xiàn)借助大語(yǔ)言模型對(duì)參會(huì)人員發(fā)言內(nèi)容進(jìn)行智能提煉的能力,提煉時(shí)需結(jié)合會(huì)議議題及相關(guān)文件;需支5持用戶單條重新提煉。需支持與省人大垂域大模型對(duì)接,調(diào)用其開放接口實(shí)現(xiàn)借助大語(yǔ)言模型對(duì)參會(huì)人員發(fā)言內(nèi)容進(jìn)行智能總結(jié)并生成會(huì)議紀(jì)要。用戶對(duì)內(nèi)容不滿意時(shí),需支持重需支持對(duì)轉(zhuǎn)寫內(nèi)容進(jìn)行編輯、修改、刪除,調(diào)整語(yǔ)序,添加發(fā)言人等操作。重新編輯后需自動(dòng)觸發(fā)AI智能提煉重新生成審議發(fā)言;針對(duì)人大常委會(huì)會(huì)議實(shí)時(shí)要求性高,為了方便工作人員編輯發(fā)言人發(fā)言內(nèi)容,需支持將頁(yè)面分為三個(gè)部分,左側(cè)為發(fā)言內(nèi)容編輯區(qū)域,右側(cè)為AI提煉內(nèi)容編輯區(qū)域,底部為語(yǔ)音輸入控制區(qū)域。需支持對(duì)采集音頻進(jìn)行回放,輔助編輯發(fā)言內(nèi)容便于校對(duì)。方便工作人員可以通過(guò)音頻回放功能了解當(dāng)時(shí)發(fā)言人的真實(shí)發(fā)言,從而更好的還原發(fā)言人的發(fā)言內(nèi)容。需支持空格鍵便捷控制開始暫停需支持對(duì)左側(cè)轉(zhuǎn)寫內(nèi)容編輯區(qū)域內(nèi)容進(jìn)行全文搜索并高亮跳轉(zhuǎn)。15.分發(fā)言人查看會(huì)議暫?;蚪Y(jié)束后,系統(tǒng)支持勾選發(fā)言人篩選查看單個(gè)或多個(gè)發(fā)言人的發(fā)言616.打印送簽AI智能提煉區(qū)域支持勾選發(fā)言人并批量打印,連接現(xiàn)場(chǎng)打印機(jī),打印紙質(zhì)文件送簽。17.輔助優(yōu)化需支持提供多種AI能力,對(duì)轉(zhuǎn)寫效果進(jìn)行優(yōu)化。1)語(yǔ)氣詞過(guò)濾針對(duì)語(yǔ)氣詞,如“嗯”、“啊啊”等,系統(tǒng)轉(zhuǎn)寫時(shí),編不展示。2)數(shù)字規(guī)整針對(duì)包含數(shù)字的語(yǔ)句,系統(tǒng)轉(zhuǎn)寫時(shí),編輯結(jié)果區(qū)域會(huì)自動(dòng)將漢字轉(zhuǎn)換成阿拉伯?dāng)?shù)字。3)關(guān)鍵詞手動(dòng)優(yōu)化針對(duì)會(huì)議中會(huì)出現(xiàn)的人名、地名、專業(yè)詞匯等個(gè)性化關(guān)鍵詞,會(huì)議審議的議題和法律草案,可提前添加至系統(tǒng)關(guān)鍵詞優(yōu)化列表中進(jìn)行效果優(yōu)化,可有效提升會(huì)議過(guò)程中的識(shí)別結(jié)果。4)關(guān)鍵詞智能優(yōu)化針對(duì)會(huì)議過(guò)程中修改的人名、地名、專業(yè)詞匯等個(gè)性化關(guān)鍵詞,系統(tǒng)會(huì)自動(dòng)進(jìn)行提取,實(shí)時(shí)進(jìn)行效果優(yōu)化,可有效提升會(huì)議過(guò)程中的識(shí)別結(jié)果。5)禁忌詞屏蔽針對(duì)日??谡Z(yǔ)交談中純

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論