版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
年4月19日智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用文檔僅供參考智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用研究[摘要]智能算法在管理大型數(shù)據(jù)庫(kù)及挖掘其中有效知識(shí)方面具有良好的性能,因此,眾多研究人員將該類(lèi)算法引入到提升圖書(shū)管理系統(tǒng)性能的研究中。本文將介紹幾類(lèi)基于關(guān)聯(lián)分析技術(shù)和基于聚類(lèi)分析技術(shù)的智能算法,并展望未來(lái)智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用前景。
[關(guān)鍵詞]智能算法圖書(shū)管理系統(tǒng)關(guān)聯(lián)分析聚類(lèi)分析
1.引言
隨著圖書(shū)館館藏資源的不斷增加,圖書(shū)館資源管理的難度也不斷加劇。從上世紀(jì)八十年代圖書(shū)館管理的自動(dòng)化變革開(kāi)始到如今大多數(shù)圖書(shū)館自動(dòng)化管理系統(tǒng)的使用時(shí)間均已超過(guò)。在間產(chǎn)生的各類(lèi)歷史數(shù)據(jù)如資源搜索記錄、讀者借閱記錄、圖書(shū)采購(gòu)記錄等,已變成一筆寶貴的財(cái)富,然而,受到現(xiàn)有管理系統(tǒng)功能的限制,這些數(shù)據(jù)僅能作簡(jiǎn)單的存儲(chǔ)及查詢(xún),其無(wú)法進(jìn)行開(kāi)發(fā)利用。在對(duì)圖書(shū)管理系統(tǒng)的多年開(kāi)發(fā)和研究中,人們發(fā)現(xiàn)各類(lèi)智能算法的數(shù)據(jù)挖掘能力將能夠大大提升圖書(shū)管理系統(tǒng)的管理能力及對(duì)數(shù)據(jù)的利用深度。本文將概括介紹近年來(lái)提到的一些智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用實(shí)例,并展望智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用前景。
2.智能算法在圖書(shū)管理系統(tǒng)中的應(yīng)用
智能算法是指在各類(lèi)復(fù)雜問(wèn)題中,能夠從大量復(fù)雜、模糊、隨機(jī)的應(yīng)用數(shù)據(jù)中找出數(shù)據(jù)產(chǎn)生規(guī)律,并對(duì)其進(jìn)行自我啟發(fā)式優(yōu)化的計(jì)算機(jī)算法。經(jīng)過(guò)智能算法從各類(lèi)大型管理系統(tǒng)的數(shù)據(jù)庫(kù)中挖掘出來(lái)的規(guī)律和知識(shí)能夠用在查詢(xún)響應(yīng)、決策支持、信息管理等許多方面。經(jīng)過(guò)研究人員多年的研究,該類(lèi)算法在圖書(shū)館系統(tǒng)中的應(yīng)用研究已取得一定成果,本部分將著重介紹幾類(lèi)經(jīng)常被提到的算法利用方式及實(shí)驗(yàn)效果。
2.1關(guān)聯(lián)分析算法
關(guān)聯(lián)規(guī)則挖掘技術(shù)由r.agrawal于1993年提出,其強(qiáng)大的數(shù)據(jù)挖掘能力,在金融業(yè)、工業(yè)領(lǐng)域及圖書(shū)管理系統(tǒng)等大型數(shù)據(jù)庫(kù)中得到充分運(yùn)用[1]。
關(guān)聯(lián)規(guī)則分析技術(shù)算法的主要思想是首先尋找給定數(shù)據(jù)集中的頻繁項(xiàng)集,然后經(jīng)過(guò)頻繁項(xiàng)集生產(chǎn)強(qiáng)關(guān)聯(lián)規(guī)則[2]。在針對(duì)圖書(shū)管理系統(tǒng)的應(yīng)用研究中,其主要包含三個(gè)步驟:第一步:將相關(guān)讀者數(shù)據(jù)經(jīng)過(guò)預(yù)處理形成讀者數(shù)據(jù)事務(wù)庫(kù);第二步,迭代識(shí)別事務(wù)數(shù)據(jù)庫(kù)中所有支持度不低于用戶(hù)設(shè)定閥值min_sup的頻繁項(xiàng)集;第二步,在頻繁項(xiàng)集中構(gòu)造所有滿(mǎn)足最小置信度閥值min_conf的關(guān)聯(lián)規(guī)則,得到相應(yīng)的讀者行為規(guī)律。算法的復(fù)雜度主要受到項(xiàng)數(shù)、事務(wù)數(shù)、事務(wù)平均寬度等因素限制,因此在實(shí)際應(yīng)用中存在以下缺陷:頻繁掃描數(shù)據(jù)庫(kù)、不適用于稠密集的關(guān)聯(lián)規(guī)則挖掘、可能生成的關(guān)聯(lián)規(guī)則過(guò)于龐大等。針對(duì)這些缺陷,近年來(lái)不少學(xué)者提出了改進(jìn)策略,如基于逆向運(yùn)算的優(yōu)化策略、基于哈希表的優(yōu)化策略、基于劃分的優(yōu)化策略等[3]。在關(guān)于將關(guān)聯(lián)分析算法應(yīng)用到圖書(shū)管理系統(tǒng)的研究中,主要包括以下幾類(lèi):
(1)鮑靜提出了一類(lèi)基于數(shù)據(jù)預(yù)處理技術(shù)和經(jīng)典關(guān)聯(lián)分析方法apriori算法的讀者借閱挖掘工具,并利用該工具對(duì)安徽省圖書(shū)館圖書(shū)流通數(shù)據(jù)進(jìn)行關(guān)聯(lián)挖掘,仿真實(shí)驗(yàn)結(jié)果表明,經(jīng)過(guò)引入興趣度對(duì)挖掘出的關(guān)聯(lián)規(guī)則進(jìn)行分析,證明該讀者借閱挖掘工具能夠?qū)崿F(xiàn)對(duì)讀者興趣度的分析,從而幫助圖書(shū)館館員為讀者提供個(gè)性化服務(wù)[4];
(2)陳康提出利用改進(jìn)的eclat算法設(shè)計(jì)圖書(shū)推薦系統(tǒng),該改進(jìn)算法源自zaki提出的一種比較典型的深度優(yōu)先搜索和交叉計(jì)數(shù)的頻繁模式挖掘算法。改進(jìn)算法充分利用了垂直數(shù)據(jù)表示和交叉技術(shù)的高效優(yōu)勢(shì),直接在垂直數(shù)據(jù)表示的數(shù)據(jù)集上經(jīng)過(guò)廣度優(yōu)先搜索和交叉計(jì)數(shù)產(chǎn)生頻繁項(xiàng)集。仿真實(shí)驗(yàn)結(jié)果表明該算法能夠在大數(shù)據(jù)量的情況下實(shí)現(xiàn)關(guān)聯(lián)規(guī)則的高效挖掘,產(chǎn)生的知識(shí)庫(kù)在圖書(shū)推薦系統(tǒng)中取得了良好的應(yīng)用效果[5];
(3)林郎蝶、王燦輝提出了一類(lèi)基于劃分優(yōu)化策略的改進(jìn)apriori算法——l-apriori算法,該算法利用《中國(guó)圖書(shū)館分類(lèi)法》將圖書(shū)按分類(lèi)號(hào)信息進(jìn)行分類(lèi)形成子圖書(shū)館,算法首先在各子圖書(shū)館中進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,再將所挖掘到的關(guān)聯(lián)規(guī)則進(jìn)行整合,從而得到最終的挖掘結(jié)果[3]。該算法的優(yōu)勢(shì)在于經(jīng)過(guò)劃分優(yōu)化后,l-apriori算法的空間復(fù)雜度僅為apriori算法的1/n,其中n為子圖書(shū)館的個(gè)數(shù)。
2.2聚類(lèi)分析算法
聚類(lèi)分析(clusteranalysis)是數(shù)據(jù)挖掘技術(shù)中的一種典型方法,該類(lèi)算法可在要?jiǎng)澐值念?lèi)未知的情況下,將數(shù)據(jù)對(duì)象分組成不同的類(lèi)。聚類(lèi)的基本方法在建立基于分析對(duì)象的數(shù)據(jù)矩陣或相異度矩陣中,經(jīng)過(guò)計(jì)算對(duì)象之間的距離來(lái)衡量對(duì)象之間的相似性或相異性,從而對(duì)數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)。由于該技術(shù)仿真了一個(gè)無(wú)監(jiān)督的學(xué)習(xí)過(guò)程,因此被廣泛應(yīng)用于各類(lèi)大型數(shù)據(jù)庫(kù)中?,F(xiàn)有的聚類(lèi)技術(shù)種類(lèi)很多,主要有層次方法、劃分方法、基于密度的方法、基于網(wǎng)格的方法、基于模型的方法等[2]。當(dāng)前,在針對(duì)圖書(shū)管理系統(tǒng)的研發(fā)中,研究人員嘗試將多種基于聚類(lèi)分析技術(shù)的算法使用在圖書(shū)管理系統(tǒng)中,并在仿真實(shí)驗(yàn)中取得了一些成果。下面內(nèi)容將具體介紹幾類(lèi)算法。
(1)武建偉、俞曉紅、陳文清等人提出了利用基于密度的動(dòng)態(tài)協(xié)同過(guò)濾算法改進(jìn)現(xiàn)有的圖書(shū)推薦系統(tǒng)[6]。與傳統(tǒng)的靜態(tài)協(xié)同過(guò)濾算法不同,動(dòng)態(tài)協(xié)同過(guò)濾算法首先利用模糊隸屬函數(shù)根據(jù)讀者借閱圖書(shū)的時(shí)間長(zhǎng)度篩選出讀者對(duì)借閱圖書(shū)的興趣度,并利用基于密度的db-scan算法在按中圖法劃分的區(qū)域中進(jìn)行聚類(lèi)操作,從而建立用戶(hù)的興趣模型。在數(shù)據(jù)的增長(zhǎng)和變化中,用戶(hù)的興趣聚類(lèi)區(qū)域密度及權(quán)重將發(fā)生變化,從而實(shí)現(xiàn)動(dòng)態(tài)的協(xié)同過(guò)濾推薦[6]。在仿真實(shí)驗(yàn)中,作者以洛陽(yáng)理工學(xué)院圖書(shū)管理系統(tǒng)讀者借閱數(shù)據(jù)為實(shí)驗(yàn)對(duì)象進(jìn)行仿真計(jì)算。結(jié)果表明,改進(jìn)后的動(dòng)態(tài)算法在鄰居數(shù)從5增加到26時(shí),其平均絕對(duì)偏差值均小于靜態(tài)算法0.05,說(shuō)明基于密度動(dòng)態(tài)的協(xié)同過(guò)濾推薦算法在預(yù)測(cè)讀者興趣度方面精度更高[6]。
(2)楊雪霞提出利用遺傳算法(geneticalgorithm,ga)為模糊k-prototypes尋找初始聚類(lèi)中心的ga-fkp算法,并取得了良好的仿真實(shí)驗(yàn)效果[7]。模糊k-prototypes(fuzzyk-prototypes,fkp)算法能夠針對(duì)由多類(lèi)型數(shù)據(jù)構(gòu)成且分類(lèi)模糊的數(shù)據(jù)集合進(jìn)行分類(lèi),然而fkp算法存在易陷入局部最優(yōu)解和初始化敏感的缺點(diǎn),為解決這個(gè)問(wèn)題,楊雪霞提出了利用遺傳算法幫助fkp算法進(jìn)行選取初始參數(shù),然后經(jīng)過(guò)kfp算法對(duì)個(gè)體進(jìn)行優(yōu)化從而得到最終結(jié)果。在ga-fkp算法的數(shù)據(jù)結(jié)構(gòu)中對(duì)遺傳算法在知識(shí)表示方面的缺陷做了很好的處理:使用聚類(lèi)中心來(lái)表示組成問(wèn)題的結(jié)果,即一個(gè)聚類(lèi)中心向量表示一個(gè)基因,而所有聚類(lèi)中心則組成了遺傳算法中的個(gè)體,如公式2-1所示。個(gè)體y中的每個(gè)基因表示如公式2-2所示。
公式2-1
公式2-2
其中,表示個(gè)體結(jié)構(gòu),為i位置基因,n為樣本數(shù),k為目標(biāo)聚類(lèi)數(shù)[7]。利用該類(lèi)編碼方式,解決了遺傳算法與kfp算法間的接口問(wèn)題,使得兩類(lèi)算法能夠相互融合,從而形成適合處理讀者細(xì)分問(wèn)題的ga-fkp算法。在仿真實(shí)驗(yàn)中,作者選用了河南師范大學(xué)圖書(shū)館到的讀者數(shù)據(jù)集進(jìn)行細(xì)分,經(jīng)過(guò)細(xì)分結(jié)果能夠幫助館員了解不同類(lèi)型讀者對(duì)圖書(shū)的利用狀況,從而為讀者提供更好的個(gè)性化服務(wù)。
(3)茹蓓、趙芳提出了利用k-means算法分析讀者借閱行為,為圖書(shū)館管理提供有用信息。k-means算法是去類(lèi)算法中的經(jīng)典算法之一,該算法首先接收輸入量k,并把n個(gè)數(shù)據(jù)對(duì)象劃分為k個(gè)聚類(lèi),然后基于對(duì)象之間的距離來(lái)計(jì)算相異度[8]。算法的主要流程包含四個(gè)步驟:第一步,隨機(jī)選擇k個(gè)對(duì)象,以每個(gè)對(duì)象為中心來(lái)代表數(shù)據(jù)集將被分成的k個(gè)類(lèi);第二步,根據(jù)“距離中心最近”的原則,尋找與對(duì)象相似的類(lèi)并將其劃分到相應(yīng)的類(lèi)中;第三步,完成對(duì)象分配后,計(jì)算每一個(gè)類(lèi)中所有對(duì)象的平均值,作為新的中心;第四步,根據(jù)“距離中心最近”的原則,重新劃分所有對(duì)象。重復(fù)執(zhí)行第三步和第四步,直到所有產(chǎn)生的類(lèi)沒(méi)有變化為止。利用該算法,能夠?qū)⒎稚⒌淖x者借閱數(shù)據(jù)進(jìn)行有效劃分,找出讀者借閱行為中的規(guī)律,從而幫助圖書(shū)館管理人員制定相應(yīng)的服務(wù)方案及館藏發(fā)展計(jì)劃。
3.前景展望
隨著圖書(shū)管理系統(tǒng)研究的不斷深入,及讀者對(duì)服務(wù)質(zhì)量要求的不斷提升。圖書(shū)館的作用早已不但僅只是借閱圖書(shū)。為各類(lèi)讀者提供個(gè)性化服務(wù),為學(xué)校提供教學(xué)、科研和發(fā)展規(guī)劃的有效信息資源已成為當(dāng)前圖書(shū)館員的工作目標(biāo)。然而,要從海量的系統(tǒng)數(shù)據(jù)中,挖掘出并準(zhǔn)確把握住不同讀者的需求,找出最有效的資源是當(dāng)前圖書(shū)館界的難題。智能算法的出現(xiàn),為解決這一難題提供了很好的解決方案,因此,眾多研究人員進(jìn)入到這一領(lǐng)域進(jìn)行了積極嘗試并獲得了良好的實(shí)驗(yàn)效果。隨著研究的不斷深入,相信這些算法將不斷成熟,并最終應(yīng)用到實(shí)際的圖書(shū)管理系統(tǒng)中。
參考文獻(xiàn):
[1]趙霞彤.數(shù)據(jù)挖掘技術(shù)在圖書(shū)管理系統(tǒng)中的應(yīng)用[d].南京:南京郵電大學(xué),.
[2]朱福喜,杜有福,夏定純.人工智能引論[m].武漢大學(xué)出版社,.283-305.
[3]林郎蝶,王燦輝.apriori算法在圖書(shū)推薦服務(wù)中的應(yīng)用與研究[j].計(jì)算機(jī)技術(shù)與發(fā)展,,5(21):22-28.
[4]鮑靜.關(guān)聯(lián)規(guī)則挖掘及其在圖書(shū)流通數(shù)據(jù)中的應(yīng)用研究[d].合肥:合肥工業(yè)大學(xué),.
[5]陳康.基于eclat算法的圖書(shū)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨境電商2025年海運(yùn)整箱貨運(yùn)合同協(xié)議
- 車(chē)檢登錄員考試題及答案
- 護(hù)理行政試題及答案
- 2025-2026五年級(jí)音樂(lè)期末測(cè)試題
- 1到4的題目答案及
- 中醫(yī)藥適宜技術(shù)培訓(xùn)課件
- 母嬰護(hù)理實(shí)踐技能訓(xùn)練
- 腸外營(yíng)養(yǎng)在腫瘤患者圍手術(shù)期的應(yīng)用策略
- 解剖室衛(wèi)生管理制度
- 衛(wèi)生服務(wù)站崗位責(zé)任制度
- 快樂(lè)讀書(shū)吧:非洲民間故事(專(zhuān)項(xiàng)訓(xùn)練)-2023-2024學(xué)年五年級(jí)語(yǔ)文上冊(cè)(統(tǒng)編版)
- GB/T 19609-2024卷煙用常規(guī)分析用吸煙機(jī)測(cè)定總粒相物和焦油
- 公路工程標(biāo)準(zhǔn)施工招標(biāo)文件(2018年版)
- DB45-T 2845-2024 超聲引導(dǎo)下針刀治療技術(shù)規(guī)范
- DL∕T 5776-2018 水平定向鉆敷設(shè)電力管線(xiàn)技術(shù)規(guī)定
- 2025屆浙江省杭州市英特外國(guó)語(yǔ)學(xué)校數(shù)學(xué)七年級(jí)第一學(xué)期期末監(jiān)測(cè)模擬試題含解析
- (正式版)JTT 728.2-2024 裝配式公路鋼橋+第2部分:構(gòu)件管理養(yǎng)護(hù)報(bào)廢技術(shù)要求
- 施工、建設(shè)、監(jiān)理單位管理人員名冊(cè)
- 圍絕經(jīng)期管理和激素補(bǔ)充治療課件
- Rivermead行為記憶能力測(cè)試
- CNC加工中心點(diǎn)檢表
評(píng)論
0/150
提交評(píng)論