下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、人工智能技術(shù)圖書信息檢索系統(tǒng)設(shè)計(jì) 摘要:針對傳統(tǒng)圖書信息檢索系統(tǒng)通過本地效勞器提供信息檢索,其檢索速率與結(jié)果準(zhǔn)確率低,且受本地計(jì)算設(shè)施性能影響較大等問題,文中采用云計(jì)算以及人工智能技術(shù)開發(fā)了高效的圖書信息檢索系統(tǒng),通過布置云端效勞器,將圖書信息檢索系統(tǒng)的計(jì)算部署在云端效勞器上,本地設(shè)施只需接收云端效勞器的計(jì)算結(jié)果,大幅減小了本地設(shè)備對信息檢索結(jié)果的限制。采用Agent技術(shù)對用戶的興趣、愛好與習(xí)慣進(jìn)展學(xué)習(xí),實(shí)現(xiàn)個(gè)性化地幫助用戶完成信息效勞任務(wù),從而提升了信息檢索效率。實(shí)驗(yàn)與測試結(jié)果說明,本檢索系統(tǒng)的召回率與準(zhǔn)確率較傳統(tǒng)檢索系統(tǒng)分別進(jìn)步了22%與18%。關(guān)鍵詞:人工智能;云計(jì)算;Agent技術(shù);信
2、息檢索隨著互聯(lián)網(wǎng)技術(shù)的快速開展,信息數(shù)字化成為一種趨勢。數(shù)字圖書館是傳統(tǒng)圖書資源信息化與網(wǎng)絡(luò)化的結(jié)果,其將圖書信息構(gòu)建成一個(gè)沒有空間、時(shí)間限制的網(wǎng)上知識(shí)共享中心。數(shù)字圖書館的核心效勞之一為信息檢索,人們通過關(guān)鍵字檢索得到數(shù)字圖書館中自身關(guān)注的資料信息。傳統(tǒng)的數(shù)字圖書館通過本地效勞器提供信息檢索,其檢索速率與正確率受本地計(jì)算設(shè)施性能影響。此外,傳統(tǒng)的圖書信息檢索方式效率低下且準(zhǔn)確率低。隨著人工智能技術(shù)的開展,人們通過人工智能實(shí)現(xiàn)了多領(lǐng)域的自主學(xué)習(xí)工作形式。因此,通過人工智能來進(jìn)展信息檢索分類的學(xué)習(xí)訓(xùn)練,進(jìn)步圖書信息檢索效率與準(zhǔn)確率成為新的方向。本文采用云計(jì)算及人工智能技術(shù),開發(fā)了高效的圖書信息檢
3、索系統(tǒng)。其通過布置云端效勞器,將圖書信息檢索系統(tǒng)的計(jì)算部署在云端效勞器上,本地設(shè)施只需接收云端效勞器的計(jì)算結(jié)果,大幅減小了本地設(shè)備對信息檢索結(jié)果的限制。其次,采用Agent技術(shù)來對用戶的興趣、愛好與特性進(jìn)展學(xué)習(xí),有針對性地幫助用戶完成信息效勞任務(wù),從而提升信息檢索效率。1云計(jì)算傳統(tǒng)計(jì)算是通過本地效勞器提供算力進(jìn)展計(jì)算,當(dāng)計(jì)算機(jī)進(jìn)展一次計(jì)算時(shí)將計(jì)算任務(wù)提交至本地效勞器進(jìn)展計(jì)算。因此,計(jì)算效率受本地效勞器性能影響。而云計(jì)算那么是將計(jì)算任務(wù)提交至云端效勞器進(jìn)展計(jì)算,其的效勞是由大量的計(jì)算單元通過IP網(wǎng)絡(luò)連接起來提供的,云計(jì)算是基于搜索引擎平臺(tái)設(shè)計(jì)的。云計(jì)算具有幾個(gè)較為明顯的特點(diǎn):1具有規(guī)模龐大的算力
4、;2具有大規(guī)模性和高彈性;3共享物理資源和虛擬化資源;4通過動(dòng)態(tài)調(diào)度來分配資源;5具有較強(qiáng)的通用性。云計(jì)算主要是通過網(wǎng)絡(luò)來提供各種各樣的應(yīng)用,這些資源包括數(shù)據(jù)存儲(chǔ)、效勞器、數(shù)據(jù)庫、網(wǎng)絡(luò)與軟件等工具和應(yīng)用程序?;谠频拇鎯?chǔ)使文件保存到遠(yuǎn)程數(shù)據(jù)庫成為可能,而不是保存在專有硬盤或本地存儲(chǔ)設(shè)備上,只要一個(gè)電子設(shè)備可以訪問網(wǎng)絡(luò),其便可訪問運(yùn)行數(shù)據(jù)與軟件程序,降低了計(jì)算對本地設(shè)備的依賴性。云計(jì)算由于本錢低、效率高、速度快而被廣泛應(yīng)用。由于被訪問的信息可以在云或虛擬空間中遠(yuǎn)程找到,提供云效勞的公司允許用戶在遠(yuǎn)程效勞器上存儲(chǔ)文件與應(yīng)用程序,然后通過互聯(lián)網(wǎng)訪問所有數(shù)據(jù),因此用戶無需在特定的網(wǎng)絡(luò)環(huán)境訪問,允許遠(yuǎn)程
5、工作。云計(jì)算的體系構(gòu)造可以分為核心棧與管理層。核心棧按不同功能可分成資源層、平臺(tái)層以及應(yīng)用層3個(gè)層次,如圖1所示。資源層也是根底設(shè)施層,其擁有物理資源、虛擬計(jì)算資源、存儲(chǔ)資源以及網(wǎng)絡(luò)資源等。平臺(tái)層包含了云計(jì)算的構(gòu)造層次,包括系統(tǒng)的分布式計(jì)算框架、文件系統(tǒng)、虛擬化以及存儲(chǔ)系統(tǒng)子層等。應(yīng)用效勞器及其組件支持常規(guī)的通用應(yīng)用邏輯。2Agent技術(shù)隨著人們累計(jì)接收到的信息量不斷激增,各種圖書數(shù)據(jù)也越來越多。目前全球圖書藏量在上億冊以上,數(shù)字?jǐn)?shù)據(jù)總量更是高達(dá)上千太字節(jié)以上。因此,單靠手工查找自身所需數(shù)字圖書資源速度慢、搜索不全面,無法滿足用戶的需求。圖書信息檢索系統(tǒng)結(jié)果,如圖2所示。可以看出,圖書信息檢索
6、系統(tǒng)工作流程為:信息搜集程序Robot在網(wǎng)上圖書庫中搜索所有圖書信息并返回搜索引擎,對搜索信息進(jìn)展頁面分類,建立索引數(shù)據(jù)庫。用戶在檢索頁面上輸入相關(guān)的檢索關(guān)鍵詞發(fā)起檢索懇求,然后檢索系統(tǒng)在索引數(shù)據(jù)庫中根據(jù)用戶提交的檢索條件與關(guān)鍵詞尋找匹配檢索懇求的頁面。最后采用超文本鏈接的形式將搜索結(jié)果返回給用戶,用戶使用搜索引擎返回的鏈接訪問相關(guān)信息。因此在整個(gè)圖書信息檢索過程中,搜索引擎的作用非常重要。傳統(tǒng)的搜索引擎用的是B/S構(gòu)造,客戶機(jī)需要與效勞器頻繁交互,導(dǎo)致搜索速度慢,資源消耗大。隨著人工智能技術(shù)的開展,人們開場研究使機(jī)器可以像人一樣進(jìn)展考慮,從而實(shí)現(xiàn)更加智能化地工作。傳統(tǒng)搜索引擎面臨兩個(gè)問題:一
7、個(gè)是信息提供者不能適時(shí)、主動(dòng)地將最有效的信息提供給用戶;另一個(gè)是用戶無法尋找最需要的信息。而Agent那么能將人查找信息轉(zhuǎn)變?yōu)樾畔⒄胰?。Agent能承受圖書發(fā)布者有關(guān)圖書信息的注冊以及用戶搜索有關(guān)圖書信息要點(diǎn)的注冊,從而可以主動(dòng)通知用戶誰可以提供自己所需要的信息,或者告訴信息發(fā)布者誰需要其發(fā)布的信息。Agent是可以在系統(tǒng)中發(fā)揮主觀能動(dòng)性的計(jì)算實(shí)體,其具有自主性、交互性、反響性以及主動(dòng)性四大特性。為了更好地實(shí)現(xiàn)信息找人,需要將整個(gè)網(wǎng)絡(luò)連成一個(gè)整體,因此需要可以在網(wǎng)絡(luò)中挪動(dòng)的Agent,即挪動(dòng)Agent,其結(jié)果如圖3所示。其由Agent與Agent效勞器組成。挪動(dòng)Agent攜帶著遠(yuǎn)程消息與客戶機(jī)
8、端Agent進(jìn)展交互,主動(dòng)提供信息給客戶機(jī)端Agent,客戶機(jī)因此獲取相關(guān)信息并深度挖掘有用信息。同一個(gè)挪動(dòng)Agent效勞器中通常具有多個(gè)挪動(dòng)Agent,Agent之間通過ACLAgentmunicationLanguage以及Agent效勞器接口進(jìn)展數(shù)據(jù)交換。ACL定義了Agent以及效勞設(shè)施間數(shù)據(jù)交互過程的語法與語義,挪動(dòng)Agent的ACL具有簡潔、應(yīng)用普遍性、通信獨(dú)立性等特點(diǎn)。不同Agent效勞器之間,那么是通過Agent傳輸協(xié)議來ATP進(jìn)展數(shù)據(jù)交互。ATP協(xié)議提供了分派、召回、提取、消息與應(yīng)答等一組原語性的接口,不同消費(fèi)商通過這些接口實(shí)現(xiàn)挪動(dòng)Agent的遷移操作。挪動(dòng)Agent雖然是計(jì)
9、算機(jī)網(wǎng)絡(luò)以及分布式系統(tǒng)開展的方向,但在復(fù)雜的網(wǎng)絡(luò)環(huán)境中面臨著較大的平安問題。因此,Agent的數(shù)據(jù)傳輸平安也極其重要。目前主要通過3個(gè)方面來保證Agent的平安傳輸,首先是將傳輸?shù)男畔⑦M(jìn)展加密,使得在傳輸過程中不被竊聽者竊取到有用信息;其次是采用身份認(rèn)證的方式防止信息被攻擊者修改;最后是通過構(gòu)造加密使得當(dāng)前主機(jī)只能理解Agent的上一次和下一次到達(dá)主機(jī)。本文采用MASTP協(xié)議來防止Agent在傳輸過程中遭受到攻擊。該協(xié)議引進(jìn)了認(rèn)證中心CA并假設(shè):1所有Agent均信任該CA且都從CA處獲取了平安證書,該證書包含了各個(gè)Agent的公鑰;2協(xié)議中用到的密鑰算法,數(shù)字簽名算法等都是平安的。協(xié)議工作過
10、程如下所述:主機(jī)A向CA中心發(fā)送經(jīng)過公鑰加密后的信息,并申請下一主機(jī)B的公鑰,然后CA將主機(jī)B的公鑰通過CA的私鑰進(jìn)展加密后發(fā)送給主機(jī)A;主機(jī)A通過主機(jī)B的公鑰對主機(jī)A的公鑰及對稱密鑰進(jìn)展加密并發(fā)送給主機(jī)B,然后主機(jī)B通過私鑰解密主機(jī)A發(fā)送的信息,并得到主機(jī)B自身的公鑰。3系統(tǒng)實(shí)現(xiàn)首先構(gòu)建了基于云平臺(tái)的數(shù)字圖書館,其架構(gòu)如圖4所示。校內(nèi)用戶通過虛擬化集群與本地私有云相連,私有云提供網(wǎng)絡(luò)存儲(chǔ)效勞,且私有云通過云接入網(wǎng)關(guān)連接到公有云。公有云平臺(tái)提供效勞器效勞,可將數(shù)字圖書館檢索懇求切分成多個(gè)任務(wù)在云效勞器上并行執(zhí)行,進(jìn)步了信息檢索的效率,且降低了用戶端對硬件資源的依賴。校外讀者以及挪動(dòng)終端同樣可通
11、過公有云來訪問數(shù)字圖書館的數(shù)據(jù)。系統(tǒng)架構(gòu)采用Agent技術(shù)的分層構(gòu)造,分別為應(yīng)用層、Agent層、平臺(tái)層以及網(wǎng)絡(luò)層。應(yīng)用層用于系統(tǒng)與用戶之間的交互,其負(fù)責(zé)將用戶的信息檢索懇求簡析后發(fā)送給Agent層或者將Agent層的檢索結(jié)果以特定格式傳遞給用戶;Agent層用于處理用戶的檢索懇求,并返回檢索結(jié)果給應(yīng)用層;平臺(tái)層決定著Agent的挪動(dòng)方向以及信息通訊;網(wǎng)絡(luò)層負(fù)責(zé)連接云效勞器進(jìn)展信息檢索。整個(gè)系統(tǒng)的工作流程,如圖6所示。首先,用戶翻開數(shù)字圖書館的檢索頁面,輸入檢索信息提交至效勞器,同時(shí)發(fā)起檢索懇求;Wed效勞Agent在接收到相關(guān)檢索懇求后,首先建立與處理用戶檢索懇求有關(guān)的主機(jī),然后建立相對應(yīng)的
12、檢索Agent,同時(shí)把相關(guān)的主機(jī)地址搜集起來并創(chuàng)立成地址列表返回給相應(yīng)的檢索Agent。檢索Agent通過效勞Agent傳遞的參數(shù)進(jìn)展初始化操作并開場檢索工作,同時(shí)在地址列表中對于主機(jī)之間轉(zhuǎn)移并進(jìn)展相關(guān)的檢索;檢索Agent根據(jù)特定的選擇策略來決定下一個(gè)主機(jī)地址。一旦確定好下一個(gè)主機(jī),檢索Agent那么轉(zhuǎn)移到該主機(jī)上,并檢索該主機(jī)上的資源來尋找符合用戶檢索需求的信息。假設(shè)尋找到符合要求的信息,那么保存檢索結(jié)果;與此同時(shí),檢索Agent會(huì)繼續(xù)按照選擇策略挪動(dòng)到列表中下一個(gè)主機(jī)來搜索用戶的檢索需求,直到遍歷搜索了地址列表中的所有主機(jī)。在檢索Agent搜索完地址列表上所有主機(jī)后,將得到的檢索結(jié)果返回
13、給效勞器,同時(shí)自行完畢進(jìn)程,完畢整個(gè)檢索流程。最后,效勞Agent將最終得到的檢索結(jié)果返回給提交檢索懇求的用戶。本文設(shè)計(jì)的圖書信息檢索系統(tǒng)主要通過3種方式來進(jìn)展圖書信息的檢索,包括簡單檢索、多字段檢索以及全文檢索,檢索頁面如圖7所示。在檢索頁面可以進(jìn)展簡單的信息搜索,首先設(shè)置檢索條件,包括文獻(xiàn)類型以及檢索類型。文獻(xiàn)類型包括中文圖書、西文圖書、學(xué)位論文、電子圖書等;檢索類型包括題名、作者、單位、中圖分類號(hào)等。然后設(shè)置檢索結(jié)果顯示參數(shù),包括每頁顯示記錄數(shù)以及入藏日期等。假設(shè)想進(jìn)展更加準(zhǔn)確的圖書信息搜索,可進(jìn)展多字段檢索。多字段檢索允許用戶在題名、出版社、責(zé)任者、ISBN號(hào)等字段進(jìn)展關(guān)鍵字匹配搜索,頁面如圖8所示。為了驗(yàn)證本文提出的圖書信息檢索系統(tǒng)的性能,采用公共數(shù)據(jù)集在本系統(tǒng)以及傳統(tǒng)系統(tǒng)上執(zhí)行圖書信息檢索。公共數(shù)據(jù)集收錄了21487個(gè)圖書文檔,按照圖書主題類別可分為1985個(gè)類別。本文主要從檢索時(shí)間、召回率以及準(zhǔn)確率這3個(gè)方面來評判檢索系統(tǒng)的性能。檢索時(shí)間表示從用戶發(fā)起檢索懇求到系統(tǒng)返回檢索結(jié)果所需的時(shí)間;召回率指系統(tǒng)檢索出來的相關(guān)文檔數(shù)與總文檔中相關(guān)文檔的總數(shù)之比;準(zhǔn)確率指系統(tǒng)檢索出來的相關(guān)文檔總數(shù)與檢索得到的文檔總數(shù)。從數(shù)據(jù)集中隨機(jī)挑選8個(gè)類別的圖書分別在本系統(tǒng)與傳統(tǒng)系統(tǒng)中進(jìn)展圖書信息檢索,其測試結(jié)果見圖9??傻帽鞠到y(tǒng)的召回率比傳統(tǒng)系統(tǒng)高22%,準(zhǔn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工廠遷移合同協(xié)議
- 工程勞動(dòng)合同范本
- 畫材進(jìn)貨合同范本
- 小院裝修合同范本
- 續(xù)簽用人合同范本
- 經(jīng)營預(yù)算合同范本
- 給客戶退款協(xié)議書
- 修建涼亭協(xié)議書
- 住校人員協(xié)議書
- 代理供電協(xié)議書
- THMSRX型實(shí)訓(xùn)指導(dǎo)書
- 2020北京豐臺(tái)六年級(jí)(上)期末英語(教師版)
- 原發(fā)性支氣管肺癌教案
- 建筑冷熱源課程設(shè)計(jì)說明書
- 教練場地技術(shù)條件說明
- 石油開采-潛油電泵采油優(yōu)秀PPT
- JJG 229-2010工業(yè)鉑、銅熱電阻
- GB/T 23280-2009開式壓力機(jī)精度
- 金壇區(qū)蘇教版六年級(jí)上冊數(shù)學(xué)第6單元《百分?jǐn)?shù)》教材分析(定稿)
- pid管道及儀表流程圖總集
- 《西游記》中女妖形象探析新譚素梅
評論
0/150
提交評論