交通大學(xué)資訊科學(xué)研究所.ppt_第1頁
交通大學(xué)資訊科學(xué)研究所.ppt_第2頁
交通大學(xué)資訊科學(xué)研究所.ppt_第3頁
交通大學(xué)資訊科學(xué)研究所.ppt_第4頁
交通大學(xué)資訊科學(xué)研究所.ppt_第5頁
已閱讀5頁,還剩105頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1,數(shù)位化圖書館現(xiàn)況與發(fā)展,柯皓仁 交通大學(xué)圖書館副教授兼數(shù)位圖書資訊組組長 .tw,2,大綱,數(shù)位化圖書館簡介 數(shù)位圖書館計(jì)劃 個人化數(shù)位服務(wù) 個人化圖書資訊環(huán)境 資料探勘與個人化、群體化數(shù)位服務(wù),3,數(shù)位化圖書館簡介,4,數(shù)位圖書館定義 Technical View,What is A Digital Library? (I),資料保存容易, 不佔(zhàn)空間 檢索功能強(qiáng)大 便利流通,What is A Digital Library? (II),以數(shù)位形式收集、保存、組織資訊,並透過通訊網(wǎng)路以容易使用的方法提供使用者作資料之搜尋、擷取、處理,大量資料的保存,快

2、速方便的檢索,遠(yuǎn)地處理資料,權(quán)限管制,7,What is A Digital Library? (III),The creation of digital information source and the movement of that information across global networks Characterized as: A collection of distributed autonomous sites (servers) that work together to give the consumer the appearance of a single coh

3、esive collection In practice Each site will most likely store a large amount of information in a wide variety of formats on a wide variety of storage media,8,What is A Digital Library? (IV),/ARL/definition.html The digital library is not a single entity; The digital library

4、 requires technology to link the resources of many; The linkages between the many digital libraries and information services are transparent to the end users; Universal access to digital libraries and information services is a goal; Digital library collections are not limited to document surrogates:

5、 they extend to digital artifacts that cannot be represented or distributed in printed formats.,9,What is A Digital Library? (V),一種分散式的技術(shù)環(huán)境,可大幅降低個人或機(jī)構(gòu)在資訊創(chuàng)造、散佈、操縱、儲存、整合和再利用上的障礙 一種讓特定讀者群藉由一致的方法來使用龐大且具有組織的資訊和知識寶庫的系統(tǒng) 一種整合了計(jì)算、儲存和通訊等方面的軟硬體服務(wù)環(huán)境,用以重現(xiàn)、模擬和延伸傳統(tǒng)圖書館所提供的以紙本或其他方法的各種服務(wù) 一群獨(dú)立發(fā)展的元件(Component),這些元件必須彼此

6、溝通、配合,才能達(dá)成使用者的需求,10,數(shù)位圖書館定義 Library View,11,數(shù)位化圖書館的定義,數(shù)位化圖書館乃是擁有相關(guān)資源(如軟硬體設(shè)備、網(wǎng)路、專業(yè)人士等)的機(jī)構(gòu),其任務(wù)在對數(shù)位形式的館藏進(jìn)行挑選、組織、提供使用、解譯、傳播、保持完整性、長期保存等工作,並使這些數(shù)位形態(tài)的館藏為特定讀者群快速且經(jīng)濟(jì)地運(yùn)用 數(shù)位化圖書館不會僅是一套單一且完整的數(shù)位系統(tǒng),允許使用者快速地從任何地點(diǎn)地點(diǎn)取得所有學(xué)科領(lǐng)域的所有資訊。相反地,數(shù)位化圖書館比較可能是異質(zhì)系統(tǒng)與異質(zhì)資源的組合、為特定的讀者群服務(wù)、為特殊的需求而建立。數(shù)位化圖書館亦將無限期地包含紙本式的館藏 數(shù)位化圖書館的相關(guān)名詞 電子圖書館 (

7、Electronic Library)、無牆圖書館 (Library without Walls)、虛擬圖書館 (Virtual Library),12,傳統(tǒng)圖書館與數(shù)位化圖書館,圖書館: 以科學(xué)方法採訪、整理、保存印刷與非印刷資料,並據(jù)以提供讀者服務(wù) 收藏與保存 組織和呈現(xiàn) 存取與檢索 分析、綜合與傳播 數(shù)位化圖書館嘗試運(yùn)用電腦與網(wǎng)路科技,協(xié)助館員完成上述工作,13,電子(數(shù)位化)圖書館的定義,數(shù)位化圖書館是結(jié)合數(shù)位化資料、檔案、典藏、資訊、知識、服務(wù)以及作業(yè)的集合體 e-Library = Electronic Data/File/Archive/ Information/Knowledg

8、e+ Automated/Electronic Service+ Automated/Electronic Operation 包含電子與非電子館藏 強(qiáng)調(diào)運(yùn)用電腦和網(wǎng)路技術(shù)於圖書館業(yè)務(wù)和服務(wù),14,e-Library的元素,Technology(Based on Library Automation System),以人性化為基礎(chǔ),15,e-Content and e-Operation,學(xué)研相關(guān)電子資源的引進(jìn) e-Journals, e-Books, e-Maps 特藏的電子化 教師著作 碩博士論文 讀書會 教師講義 臺南小吃臺灣古蹟 畢業(yè)光碟,電子化業(yè)務(wù) (技術(shù)服務(wù)) 提升館員工作效率與品

9、質(zhì) 業(yè)務(wù)與決策參考的依據(jù) Example 轉(zhuǎn)錄編目(Copy Cataloging) EDI 熱門書流通政策 複本查驗(yàn)與採購,16,e-Service 的趨勢,運(yùn)用電腦與網(wǎng)路科技來從事圖書館讀者服務(wù) 協(xié)助讀者獲取資訊、運(yùn)用資訊,從而產(chǎn)生新的知識 電子化服務(wù)的趨勢 個人化 量身定做的服務(wù)(Customization) 有效果的服務(wù)(Effective) 有效率的服務(wù)(Efficiency) 群體化 由具有相同興趣、專長的個體彼此激發(fā)靈感、分享心得和知識 User Cluster/Community, Sharability 私密性 (Privacy),17,結(jié)合個人化與群體化的電子化服務(wù),Lib

10、rary Automation,Digital Library,LocalSystem,Query Routing/Information Indexing/Filtering Mechanism,18,數(shù)位圖書館計(jì)畫,19,相關(guān)計(jì)畫,US Digital Library Initiatives () Library of Congress () NASA () Project Open Book-Yale University (/pre

11、servation/pobweb.htm) UK Electronic Libraries Program (eLib) http:/www.ukoln.ac.uk/services/elib/ 國科會數(shù)位博物館專案 國家典藏計(jì)畫,20,美國數(shù)位圖書館先導(dǎo)計(jì)畫,Digital Library Initiative Phase I 美國NSF、DARPA 、 NASA 合資贊助( 24.3M) 為提供資訊系統(tǒng)與服務(wù)給各界使用者,使其能取得分散不同地區(qū)且一致性的資訊 目標(biāo) 透過通訊網(wǎng)路大幅提昇蒐集、儲存、組織數(shù)位資訊的方法,使其便於搜尋、存取及處理 將基礎(chǔ)科學(xué)與科技革新建立起更完善的結(jié)合 以四年的

12、時間(1994-1998)協(xié)助六所大學(xué)進(jìn)行數(shù)位圖書館先導(dǎo)計(jì)畫 /dlione/,21,美國數(shù)位圖書館先導(dǎo)計(jì)畫,加州大學(xué)柏克萊分校 環(huán)境規(guī)劃與多媒體資訊系統(tǒng) / 加州大學(xué)聖芭芭拉分校 亞歷山卓計(jì)畫:地理資訊系統(tǒng) / 卡內(nèi)基麥隆大學(xué) 數(shù)位影像圖書館 /,22,美國數(shù)位圖書館先導(dǎo)計(jì)畫,伊利諾大學(xué)厄巴納香檳分校 統(tǒng)合科學(xué)文獻(xiàn)資料庫 /

13、密西根大學(xué) 智慧型網(wǎng)路資訊搜尋者 /UMDL/ 史丹佛大學(xué) 各類數(shù)位圖書館網(wǎng)路服務(wù)之整合機(jī)制 /diglib/,23,DLI-Phase I,UC Berkeley Digital Library Project Work-centered Digital Information Services Primary testbed database contains environmental information Image content query (Xerox PARC) Techniques

14、 for database extraction Multivalent documents (MVD) Natural language processing (NLP) Automatic categorization /,24,DLI-Phase I,UC Santa Barbara - Alexandria Project Spatially-referenced Map Information (GIS) Testbed database consists map, aerial photographs, atlases, gaze

15、tteers, and other spatially indexed information Spatial indexing and retrieval Rapid response to image data queries Image processing using features Related to a distributed digital library for geographically reference information ,25,DLI-Phase I,The Carnegie Mellon Univ.

16、: Informedia Fully automated information extraction Testbed database consists of 1000 hours of digital video from archives of public television station Creating and searching this interactive on-line digital video library Image analysis, Speech recognition, Face recognition, Natural language underst

17、anding /,26,DLI-Phase I,University of Michigan Digital Library Intelligent Agents for Information Location Testbed database contains earth and space science multi-media information Scalability using agents to help unify diverse collections and locate information Educat

18、ion inquiry-based education /UMDL/,27,DLI-Phase I,The Illinois Digital Library Project Developing the information infrastructure to effectively search technical documents on the Internet Building testbed centered around journals and magazines in the engineering and science lite

19、rature Developing widely usable Web technology and software Developing semantic search technology,28,DLI-Phase I,Stanford University: InfoBus Interoperation among Heterogeneous Services A small testbed contains computer science literature Investigating different database infrastructures for DL suppo

20、rt primarity focusing on CORBA(Common Object Request broker Architecture) Investigating different network infrastructures for DL Investigating a WWW annotation service which allows “permanent” annotation of Web pages without modification to the original /diglib/,29,DLI-Phase

21、 II,Government Agencies National Science Foundation (NSF) Defense Advanced Research Projects Agency (DARPA) National Library of Medicine (NLM) Library of Congress (LOC) National Endowment for the Humanities (NEH) National Aeronautics Accelerate development, management and accessibility of digital co

22、ntent and collections; Create new capabilities and opportunities for digital libraries to serve existing and new user communities, including all levels of education; Encourage the study of interactions between humans and digital libraries in various social and organizational contexts,31,DLI-Phase II

23、,Period: 1998-2002 Widen the efforts in digital libraries, particularly into the medical and humanities disciplines 3 major components: Research, Testbeds, Applications Component Evolving Undergraduate Emphasis component International Digital Libraries Collaborative Research component,32,DLI-Phase I

24、I,Related URLs /dlib/july99/07lesk.html /dlib/july99/07griffin.html /pubs/1998/nsf9863/nsf9863.htm /pubs/1998/nsf9863/nsf9863.htm,33,Other Major US DL Research Activities,Library of Congress (http:/lcweb.loc

25、.gov) National Aeronautics and Space Administration, NASA () Defense Advanced Research Projects Agency (DARPA) D-Lib Program () Project Open Book-Yale University (/preservation/pobweb.htm),34,eLib phase I & II,Electronic publishing Electronic jo

26、urnals the Internet plays havoc with business models Pre-prints supply services need comprehensive catalogues /systems (to find the stuff before buying it) Supporting studies human systems resist change Training and awareness people, not technology, represent the important issue,35,eLib Phase III,It

27、 aims to bring many separate developments together 4 components Hybrid libraries Large scale resource discovery, or clumps Preservation Turning early projects into service,36,Significant Development of eLib,Quiet authentication Rights or terms and conditions metadata Integrity and authenticity of el

28、ectronic documents to replace the authority of the published work Useful copyright management systems Simple information trading More sophisticated electronic commerce,37,Significant Development of eLib,Scalability issues Metadata inter-operability Daughter of Z39.50 Machine-independent, object-orie

29、nted packaging of digital library material Information longevity issues - digital preservation,38,數(shù)位圖書館研究方向,Collection Development Interoperability Framework Standards Resource Discovery: Metadata Information Organization: Classification and Indexing Information Retrieval User Interfaces Access and

30、File Management,User Studies Evaluation Legal Issues Social Issues Preservation Implications for Library Managers ,39,個人化數(shù)位服務(wù) 個人化圖書資訊環(huán)境,40,前言,建置個人化圖書資訊環(huán)境的背景 一般數(shù)位圖書館無法提供快速、有效率的資訊服務(wù) 操作界面統(tǒng)一、失去彈性 搜尋結(jié)果繁多 資源眾多、不易尋找 個人化數(shù)位圖書資訊服務(wù)可讓資訊的傳遞更加靈活 個人化的使用者界面 (Customizable User Interface ) 提高檢索結(jié)果的正確性 (Effective Searc

31、h) 確保使用者的隱私權(quán) (Privacy),41,前言 (續(xù)),動機(jī) 將個人化資訊服務(wù)技術(shù)應(yīng)用在數(shù)位圖書館中 動態(tài)偵測使用者興趣 使用資訊過濾技術(shù)提升搜尋效能 個人化圖書資訊環(huán)境的目標(biāo) 個人化使用環(huán)境 個人化搜尋服務(wù):動態(tài)偵測使用者的興趣,幫助使用者找尋資料 資訊選粹服務(wù):依使用者興趣,通知使用者有興趣的新進(jìn)資訊及事項(xiàng),42,相關(guān)研究,個人化資訊服務(wù)技術(shù) 個人化使用界面 (Customizable User Interface ) 個人興趣記錄 (User Profile) 資訊選粹服務(wù) (Selective Dissemination of Information) 個人化檢索 (Pers

32、onal Search),43,相關(guān)研究 (續(xù)),個人化使用界面 (Customizable User Interface) 使用者可以依自己的喜好來排列組合他的使用環(huán)境 自訂桌面、更改顏色、選擇服務(wù) 搜尋網(wǎng)站 MyYahoo!、MyKimo 個人報紙 CNN Custom News、LA Times Custom Services 數(shù)位圖書館 MyLibrary 、MyLibraryNCSU 、MyGateway,44,相關(guān)研究 (續(xù)) 個人興趣記錄,由讀者人工填寫個人興趣記錄 (User Profile) 方法 興趣關(guān)鍵字 MyLibraryNCSU 興趣類別 MyYahoo! 優(yōu)點(diǎn):直覺

33、 (因?yàn)槭怯墒褂谜咻斎肱d趣資料) 缺點(diǎn) 使用者會以過於普遍的字來描述興趣,對興趣的描述不夠精確 不能期望使用者都是勤勞、有足夠耐心,且總是能正確輸入關(guān)鍵字詞,45,相關(guān)研究 (續(xù)) 個人興趣記錄,運(yùn)用電腦科技推導(dǎo)產(chǎn)生 以瀏覽過網(wǎng)頁之關(guān)鍵字為興趣 Tu99 Crabtree 98 不精確,因?yàn)榫W(wǎng)頁太過龐雜 以電子郵寄通信記錄的關(guān)鍵字為興趣 Crabtree 98 由通信記錄抽取關(guān)鍵字,再依固定時間間隔將關(guān)鍵字加以分群(Clustering) 以電子交易行為推導(dǎo)興趣 Amazon 以讀者借閱歷史紀(jì)錄推導(dǎo)興趣 鄭愁予、席慕容、楊牧 新詩,46,相關(guān)研究 (續(xù)),資訊選粹服務(wù) 根據(jù)個人興趣記錄,依使用

34、者興趣過濾出使用者有興趣的新進(jìn)資訊。 資訊過濾 內(nèi)容式資訊過濾技術(shù) (Content-based Information Filtering) 以文件的內(nèi)容做為過濾的對象,使用者在興趣檔中只要紀(jì)錄有興趣的關(guān)鍵字,系統(tǒng)便會將新進(jìn)資訊和興趣檔做比對 協(xié)力式資訊過濾技術(shù) (Collaborative Information Filtering) 個人新聞服務(wù):CNN Custom News 、LA Times Custom News Services 、MyYahoo! 個人新書通報服務(wù) MyLibraryNCSU,47,相關(guān)研究 (續(xù)),個人化檢索 依個別讀者的需求幫助使用者尋找所需資訊 以資訊過

35、濾技術(shù)過濾檢索結(jié)果,48,各系統(tǒng)比較,49,動態(tài)學(xué)習(xí)使用者興趣,透過檢索策略來解讀使用者興趣 個人檢索策略的頻率 各檢索策略的相關(guān)性 時間對興趣的影響 利用個人興趣關(guān)連圖來求得使用者興趣 資訊選粹 個人化檢索,50,個人興趣關(guān)連圖,藉由關(guān)連圖,我們可以很清楚地看出使用者所有興趣間的關(guān)連性 若某一使用者之關(guān)連圖中有兩個端點(diǎn)以邊線相連,則對該使用者而言代表其曾經(jīng)同時使用過兩個端點(diǎn)所代表的檢索語。 可計(jì)算各檢索語 (Query Term) 之間關(guān)係,求出權(quán)重 (Weight) 、判斷使用者的興趣。,51,時間對興趣的影響,時間對興趣的影響呈半衰期 (half-life) 遞減 方法 將檢索歷程固定時

36、間間隔劃分成 n 個區(qū)段 第k區(qū)段對使用者整體興趣影響率為 範(fàn)例 n =5 (k1, k2, k3, k4, k5) = (16/31, 8/31, 4/31, 2/31, 1/31),Hlk: 第k時區(qū)的時間係數(shù),52,關(guān)鍵字權(quán)重計(jì)算,考慮時間與個人關(guān)鍵字的使用頻率,Wi :檢索語 i 的權(quán)重。 TFi,k:在第k個時間區(qū)段中,使用者使用檢索語 i 的頻率 n,k :在第k個時間區(qū)段中,使用者使用的檢索語總數(shù) Hlk :在第k時區(qū)中時間對興趣的影響係數(shù),頻率,總數(shù),時間係數(shù),53,使用者興趣關(guān)鍵字詞(範(fàn)例),以2星期為一個週期,求“Digital Library”於每星期結(jié)束時權(quán)重的變化,5

37、4,關(guān)鍵字關(guān)連權(quán)重計(jì)算,目的: 計(jì)算兩兩關(guān)鍵字詞的關(guān)連程度 方法,Wij :對個別使用者而言 i AND j 這個檢索語的權(quán)重 :在第k個時間區(qū)段中,使用者使用i檢索語時亦會使用j檢索語的權(quán)重 EFijj :在第k個時間區(qū)段中,使用者的檢索策略中含有 i AND j 這 個檢索策略的頻率 Hlk :在第k時區(qū)中時間對興趣的影響係數(shù),i 出現(xiàn)的頻率,j 出現(xiàn)的頻率,i AND j 出現(xiàn)的頻率,時間係數(shù),55,個人檢索策略關(guān)連 (範(fàn)例),以2星期為一個週期,求“Digital Library” 以及 ”Interface ”每星期結(jié)束時兩者關(guān)係的權(quán)重變化,56,新進(jìn)資訊選粹,方法 利用個人興趣關(guān)連

38、圖之關(guān)鍵字權(quán)重計(jì)算方法 選出前幾個關(guān)鍵字詞作為使用者興趣關(guān)鍵字詞 比對使用者興趣關(guān)鍵字詞與新進(jìn)資訊 若相符則該資訊為使用者有興趣的新進(jìn)資訊,57,檢索結(jié)果選粹,方法 根據(jù)個人興趣關(guān)連圖找出和當(dāng)次檢索策略有關(guān)的使用者興趣關(guān)鍵字詞 根據(jù)檢索結(jié)果資料所含使用者興趣關(guān)鍵字詞多寡與權(quán)重排列檢索結(jié)果,Query,Personal Search,Profiles,Personal Search Result,PKRG (Keyword Relationship Extraction),Query Strategies,Digital Library,58,PIENCTU交大個人化數(shù)位圖書資訊環(huán)境,目的 針對

39、使用者需求給予個別的使用環(huán)境 動態(tài)偵測讀者興趣,協(xié)助讀者尋找交大圖書館館藏 提供資訊選粹服務(wù),定期通知讀者有興趣的新進(jìn)資訊,59,PIENCTU系統(tǒng)簡介,中西文新書整合目錄 個人化使用者界面 個人環(huán)境設(shè)定 個人化桌面 個人服務(wù)設(shè)定 個人興趣設(shè)定 個人化搜尋引擎 個人書籤 個人新書選粹服務(wù) 個人通告 管理者界面,60,中西文新書整合目錄,交通大學(xué)圖書館現(xiàn)行分類狀況 中文:中國圖書分類法 西文:美國國會圖書分類法 交大圖書館現(xiàn)有新書目錄的缺點(diǎn) 書少而類多 類別無法中西文對照 中西文類別對照簡表 以中國圖書分類法為基礎(chǔ) 二階層的中西文類別對照簡表 9個類別 (main classes) 、52個簡表

40、 (outline of the classification tables) 以讀者角度切入製作而成,61,中西文新書整合目錄(續(xù)),中西文新書整合目錄 利用中西文類別對照簡表 將新書重新分類 貢獻(xiàn) 可提高讀者瀏覽圖書館新進(jìn)館藏的效率 可知道圖書館當(dāng)月新書在各類別的分佈情形以及中西文新書的比重,62,個人環(huán)境設(shè)定,個人化桌面 讀者能動態(tài)改變使用界面 PIENCTU提供的可個人化類別包括:圖書館服務(wù)、圖書館導(dǎo)覽、館藏查詢、資料庫查詢、新書通告、借閱狀況、檢索界面、系統(tǒng)公告、圖書館連結(jié)等 個人服務(wù)設(shè)定 啟動/取消服務(wù): 個人新書目錄,藝文活動通告,圖書館公告 個人興趣設(shè)定 彌補(bǔ)系統(tǒng)判斷使用者興趣

41、的不足 讀者自行選填興趣 選擇系統(tǒng)關(guān)鍵字詞 設(shè)定個人興趣關(guān)鍵字詞 設(shè)定個人興趣類別,63,個人化搜尋引擎,PIENCTU提供兩種個人化搜尋引擎服務(wù) 個人館藏查詢 直接抓取交通大學(xué)館藏查詢系統(tǒng)的檢索結(jié)果,以獲得所需資訊 個人新書查詢 系統(tǒng)定期從圖書館館藏系統(tǒng)中抓取新進(jìn)館藏存在PIENCTU的資料庫 讀者查詢新書時,則從本地的資料庫中獲取所需資訊,64,個人化搜尋引擎 (範(fàn)例),貝多芬?,65,個人化搜尋引擎 (續(xù)),以“貝多芬”為索引點(diǎn)產(chǎn)生出來的檢索結(jié)果,66,個人書籤個人通告,個人書籤 個人興趣書籤 可讓使用者紀(jì)錄有興趣書目的超連接、及使用者的註解。 個人通告 PIENCTU會個別通知和讀者有

42、關(guān)的訊息,如圖書館公告、還書逾期通知等。,67,個人新書粹選服務(wù),定期比對圖書館新進(jìn)書刊和使用者興趣是否相符,68,管理者界面,新增、刪除、修改PIENCTU網(wǎng)站 更改自動執(zhí)行程式的相關(guān)設(shè)定 發(fā)送圖書館通知,69,資料探勘與個人化、群體化數(shù)位服務(wù),70,資料探勘,資料探勘:從儲存於資料庫、資料倉儲或其他資訊儲存器的大量資料中發(fā)掘出我們感興趣的知識之處理過程 尿布與啤酒,71,資料探勘程序,Logical Database,Selected Data,Preprocessed Data,Transformed Data,Extracted Information,Assimilated Know

43、ledge,Analyze and,Assimilate,Select,Preprocess,Transform,Mine,72,相關(guān)規(guī)則探勘及有序性規(guī)則探勘,Association rules and Sequential patterns Given two thresholds c and s we want to find rules XY with sup(xy) s and conf(xy) c in given database. Two Step of Mining Association Rules and Sequential Patterns Find the Large

44、 Itemsets Generate the desired rules.,73,動機(jī)與目的,動機(jī) 應(yīng)用資訊科技及企業(yè)化模式經(jīng)營圖書館 目的:利用資料探勘及統(tǒng)計(jì)技術(shù),以達(dá)成: 探索讀者社群關(guān)係 個人化及群體化服務(wù) 吸引讀者到館借閱 個人化及群體化服務(wù) 提昇館藏借閱率 個人化及群體化服務(wù) 提昇讀者忠誠度 個人化及群體化服務(wù) 協(xié)助館藏複本採訪政策 電子化業(yè)務(wù) 促進(jìn)館藏流通率電子化業(yè)務(wù),74,Mining in LIBNCTU,資料來源 交通大學(xué)圖書館之書目、館藏及交易歷史資料 資料選取 書目、館藏資料:圖書405,785本,期刊:526,868本,可外借館藏不含複本282,250本 交易資料:19

45、98/1/1 至2000/8/31之交易歷史資料共441,688筆 資料前置處理及轉(zhuǎn)換 館藏借閱之共同性:每位讀者於一段時間內(nèi)(如一學(xué)期或一學(xué)年)所借閱及預(yù)約之書目為一筆交易 館藏借閱之順序性:每位讀者借閱過之館藏所形成之序列為一筆交易,75,探索讀者社群關(guān)係,館藏借閱之共同性 興趣類似之讀者所借閱之館藏也很類似 館藏借閱之順序 先借入門之館藏再借進(jìn)階之館藏 結(jié)合個人化服務(wù),76,探索讀者社群關(guān)係 (續(xù)),資料選取 1999年之交易歷史資料。 資料前置處理及轉(zhuǎn)換 假設(shè)每位讀者在1999年所借過的書為一筆交易。 交易筆數(shù) 10,773筆。 最小支持度 0.15%,約為16筆。,77,探索讀者社群

46、關(guān)係(續(xù)),館藏借閱之共同性 :1999年,78,探索讀者社群關(guān)係(續(xù)),討論 1999年一起借閱某二部影片之人數(shù)最多 影片的數(shù)量比圖書少。 影片通常分為上、下二集。 最小支持度太大(大於0.2%)則無法找出我們所感興趣的資料,最小支持度設(shè)太小(小於0.15%)又會造成記憶體不夠用。 解決方法: 將每筆交易時間之間隔拉長為1998年1月至2000年8月。 將只有一筆資料之交易去掉,減少交易筆數(shù)。 將書籍和影片分開探勘。,79,探索讀者社群關(guān)係(續(xù)),討論 圖書館與商店之差異性 商店:同一種東西有很多個 圖書館:同樣的書只有一本或兩本 解決方法: 將預(yù)約書資料加到交易記錄。,80,探索讀者社群關(guān)

47、係(續(xù)),資料前置處理及轉(zhuǎn)換 將資料量增加為1998年1月至2000年8月的資料。 拉長交易時間之間隔,讀者所借過之所有館藏為一筆交易。 刪除只借閱一本館藏之交易歷史資料。 加入預(yù)約書資料。 針對書籍部份做探勘。 交易筆數(shù) 11,398筆。 最小支持度 0.21%,約為24筆。,81,探索讀者社群關(guān)係(續(xù)),1998年1月至2000年8月書籍部份之讀者社群關(guān)係,82,吸引讀者到館借閱,問題 全部讀者人數(shù)有多少?真正來館借閱的讀者有多少?是否可增加館藏借閱之讀者人數(shù)? 2000年8月交通大學(xué)有效讀者人數(shù):13,322人 交通大學(xué)有效讀者在1998年1月2000年8月有借閱館藏之人數(shù)為9,092人

48、,佔(zhàn)有效讀者之62.25%,83,吸引讀者到館借閱(續(xù)),1999年每月借閱館藏人數(shù)分佈圖,84,吸引讀者到館借閱(續(xù)),方法 找出最熱門之20本館藏。 寄發(fā)信件推薦給未曾借閱館藏之讀者。,增加讀者人數(shù),熱門書 (Top 20),寄信給讀者 建議讀者借閱熱門書,85,吸引讀者到館借閱(續(xù)),借閱排行榜 (2000.4.262001.4.26之Top 20),86,吸引讀者到館借閱(續(xù)),結(jié)果分析 寄發(fā)推薦書及新書給未曾借閱館藏之讀者,回收信件結(jié)果如下: 寄發(fā)信件數(shù):798封 回收信件數(shù):128封 有效信件數(shù):110封 感興趣之讀者人數(shù):106封,佔(zhàn)96.36% 不感興趣之讀者人數(shù):4封,佔(zhàn)3.

49、64%,87,提昇館藏借閱率,問題 有些館藏未曾被借閱過,如何推銷這些館藏? 全部館藏: 405,785本圖書,526,868本期刋 可借館藏:282,250本(不含複本) 1998年1月2000年8月有被借閱之館藏 含複本:143,956本 不含複本:123,647本,佔(zhàn)可借館藏之43.8%,88,提昇館藏借閱率(續(xù)),方法 依“中國圖書分類法”、“美國國會圖書分類法”及“主題”將館藏做分類。 將同一類別之館藏推薦給讀者。,讀者借閱書籍 資料庫系統(tǒng)概論,找出類別及主題並 找出相同類之書目,將此書目建議給讀者,(中)312:自然科學(xué)類(Natural Sciences)-數(shù)學(xué) (美)QA:Sc

50、ience-Mathematics 資料庫管理系統(tǒng)-,MS SQL Server6.5秘笈大剖析 架設(shè)Web Server for SQL 6.5 Microsoft 資料庫開發(fā)手冊,89,提昇館藏借閱率(續(xù)),結(jié)果分析 寄發(fā)相同類別之書目給讀者,回收信件結(jié)果如下: 寄發(fā)信件數(shù):98封 回收信件數(shù):31封 有效信件數(shù):29封 有興趣的讀者:28封,佔(zhàn)96.55% 沒興趣的讀者:1封,佔(zhàn)3.45%,90,提昇讀者忠誠度,問題 很多讀者只借閱一兩次?如何讓這些讀者持續(xù)借閱? 1999年有借閱館藏之讀者:13,498人。 館藏借閱少於10本:7,057人,佔(zhàn)了52.28% 交通大學(xué)有效讀者在1998

51、年1月2000年8月有借閱館藏之人數(shù)為9,092人。 館藏借閱少於10本:3,040人,佔(zhàn)了33.44%,91,提昇讀者忠誠度(續(xù)),1999年館藏借閱本數(shù)之人數(shù)分佈圖,92,提昇讀者忠誠度(續(xù)),1999年館藏借閱本數(shù)為10本以下之人數(shù)分佈圖,93,提昇讀者忠誠度(續(xù)),方法 藉由資料探勘發(fā)掘出之讀者社群關(guān)係推薦館藏給讀者,增加讀者繼續(xù)借閱館藏之機(jī)率。,讀者借閱館藏 MATLAB入門引導(dǎo),找出讀者之特性,將書目建議給讀者,MATLAB入門引導(dǎo) PC MATLAB入門與實(shí)例應(yīng)用,PC MATLAB入門與實(shí)例應(yīng)用,94,提昇讀者忠誠度(續(xù)),結(jié)果分析 寄發(fā)館藏借閱共同性及順序性之書目給讀者,回收

52、信件結(jié)果如下: 寄發(fā)信件數(shù):368封 回收信件數(shù):134封 有效信件數(shù):132封 感興趣之讀者人數(shù):127封,佔(zhàn)有效問卷之96.21% 不感興趣之讀者人數(shù):5封,佔(zhàn)有效問卷之3.79%,95,協(xié)助館藏複本採訪政策,問題 哪些館藏需多買一些複本? 目前採行方法 電腦類館藏 讀者推薦,多人預(yù)約 可行方法 多人重複借閱及預(yù)約 多人預(yù)約 持續(xù)有讀者借閱及預(yù)約,96,協(xié)助館藏複本採訪政策(續(xù)),方法,多人重複 借閱及預(yù)約,Yes,多人 預(yù)約,持續(xù)有人 借閱及預(yù)約,Yes,建議圖書館 添購複本,建議圖書館 不需添購複本,No,No,讀者推薦,97,協(xié)助館藏複本採訪政策(續(xù)),多人重複借閱的書,98,協(xié)助館藏複本採訪政策(續(xù)),多人重複預(yù)約的書,99,促進(jìn)館藏流通率,問題 熱門書一借便是一個月,如何讓更多人借閱? 方法 學(xué)期初統(tǒng)計(jì)熱門預(yù)約書 縮短熱門預(yù)約書之借閱期限 國立交通大學(xué)採行辦法 “當(dāng)學(xué)期熱門書” :開學(xué)後一個月內(nèi),被列入“預(yù)約排行榜”前50名之圖書。 “當(dāng)學(xué)期熱門書”在該學(xué)期中(不含寒暑假)之借書

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論