版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1
數(shù)據(jù)庫結(jié)構(gòu)與組織
2數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫組織方式循序檔sequential隨機檔randomfile索引循序檔indexed-sequentialhierarchical數(shù)據(jù)庫組成元素Database
RecordsFieldsSubfields3數(shù)據(jù)庫結(jié)構(gòu)網(wǎng)絡(luò)型:多父多子階層型hierarchical
一父多子關(guān)系型relational
表格關(guān)聯(lián)4數(shù)據(jù)庫的組織在線信息系統(tǒng)Dialog數(shù)據(jù)庫ERIC是Dialog的file1記錄(record)ERICrecords>1,000,000資料欄位(field)每一record有一連串的資料欄位。次欄位(sub-field)7001|a吳|b政叡資料元(dataelements)5數(shù)據(jù)庫的層次File檔案--Afileisanorganizedcollectionofrelatedrecords.由一組相關(guān)的記錄所組成。Record記錄--Arecordisacollectionofrelateddataitemsorfields.由一組相關(guān)的數(shù)據(jù)欄組成。Field欄--Afieldisanitemofdata.在記錄中的一項數(shù)據(jù)。Name:PeterChanSex:MAge:22AcademicQualification:-……………..6數(shù)據(jù)庫基本名詞定義Record(紀錄)用來儲存以供檢索之文件描述Entity(實體)儲存信息的物件e.g.一本書、一篇文章Attribute(屬性)可用來描述實體的特性Value(屬性質(zhì))用來描述實體特性的內(nèi)容Field(欄位)用來描述屬性質(zhì)的一串字符Subfield(次欄位)Data(資料)7屬性與屬性值—以書為例Attributes(屬性)AttributeValues(屬性值)作者(Author)吳政叡書名(Title)都柏林核心集與圖書著錄出版商(Publisher)臺灣學生出版地(cityofpublication)臺北市出版年(dateofpublication)2000[民89]頁數(shù)(numberofpages)2188資料組成元素DataElementExampleTextrepresentedBit1or0Byte0100110&SubfieldPlaceofpublicationChicago,IllinoisfieldPublicationstatementChicago,Illinois:AcademicPress,1985RecordAnERICindexrecord大于983,000DatabaseTheERICdatabaseLibraryAllDialogdatabases>200個databases9檔案的組織SequentialFile循序檔:最簡單、依序RandomFile隨機檔:以數(shù)學函數(shù)算位址Indexed-SequentialFile索引檔:主要資料區(qū):儲存檔案資料溢位區(qū):溢位被擠出之資料存放區(qū)索引區(qū):記載每一存放記錄的儲存位置10檔案組織--循序檔特性:將檔案中的資料依照一筆一筆地存放在儲存裝置上,如欲存取檔案中之資料時,必須依照檔案中資料排列的順序讀取資料。11檔案組織--循序檔優(yōu)點:檔案中的紀錄長度沒有限制且最節(jié)省儲存區(qū)空間。缺點:存取效率差及不適于實時處理作業(yè)且資料的更新作業(yè)可能涉及大量資料搬移動作因此較不經(jīng)濟。適用儲存裝置:讀卡機、磁帶、磁碟、磁鼓與磁盤。循序檔適用時機:整批處理。12檔案組織
直接存取檔(DAM)
1.特性:紀錄利用數(shù)學函數(shù)來計算其位址,再根據(jù)此位址將紀錄直接存放在儲存裝置內(nèi)。
2.優(yōu)點:
a.支援循序、直接存取。
b.若資料有異動不會有大量資料搬移的動作。
c.適合實時處理作業(yè)。13檔案組織--索引檔特性:利用一個索引表格來記載在檔案中的位置,當程序欲尋找紀錄之位置時,必須先透過索引表格作找尋紀錄位址之動作。14檔案組織--索引檔組成:
1.主要資料區(qū)(PrimeDataArea): 儲存檔案資料得區(qū)域。
2.溢位區(qū)(OverflowArea): 當主要資料區(qū)的空間不敷檔案使用時,會將無法存入主要資料區(qū)中的資料存在此區(qū)。
3.索引區(qū)(IndexArea): 所有紀錄在主要資料區(qū)中的位址均會記錄在此區(qū)中,借以方便資料存取的動作。15檔案組織--索引檔優(yōu)點:
1.支援循序、直接存取。
2.若資料有異動,不會有大量資料搬移的動作。
3.適合實時處理作業(yè)。16檔案組織--索引檔缺點:
1任何資料存取均需兩次因此較耗時。
2.索引區(qū)固定會占用一部份額外儲存空間。
3.需留溢位空間因此無法妥善利用儲存空間。
4.若溢位情形嚴重將使效能降低。
5.循序存取效率較循序檔差,隨機存取效率較直接檔差。適用存取裝置:磁碟、磁鼓及磁盤17主檔與異動檔主檔:特性:主檔會儲存全部的資料,因此資料最完整、內(nèi)容最多且較少修改。例:圖書館系統(tǒng)的讀者資料檔、書目資料檔。
18主檔與異動檔異動檔:特色:用于修正主檔內(nèi)容,又稱為明細檔,因此內(nèi)容較少且僅包含某段時間內(nèi)主檔修正的信息。例:每日流通資料。19檔案組織--相對檔相對檔(relativefile)是以紀錄中之某一特定欄位做為紀錄之位址,此欄位稱為相對鍵。以相對鍵(relativekey)之內(nèi)容來將紀錄儲存在儲存裝置中。20檔案組織—倒置檔在檔案中欲搜尋某筆記錄時,通常是利用主要鍵欄來找尋;若再建立一個檔案結(jié)構(gòu)時定義了由輔助鍵欄來找出紀錄在檔案中的位址及對應(yīng)之主要鍵欄之方法,則此種檔案結(jié)構(gòu)即為所謂的倒置檔或反轉(zhuǎn)檔(invertedfile)。21基本檔案結(jié)構(gòu)Linearfile(線性檔)--Printfile依每一筆資料的編號連續(xù)儲存Invertedfile(倒置檔)--Indexfile將線形檔中每一個可供檢索的字依字母順序排列,并指出此字在線形檔中的位置可知此字出現(xiàn)在哪些紀錄,且方便直接調(diào)閱該紀錄常見倒置檔基本索引檔(basicindexfile)附加索引檔(additionalindexfile)索引典檔(thesaurusindexfile)訊息檔(Postingfile)22書目記錄結(jié)構(gòu)與欄位—
以ERIC為例DIALOGBlueSheet所提供之資料/bluesheets/html/bl0001.htmlResourcesinEducation(RIE)14,000documentseachyearCurrentIndextoJournalsinEducation(CIJE).20,000journalarticles,extractedfrommorethan750serials23DIALOG—ERIC線形檔24DIALOG—ERIC基本索引檔25DIALOG—ERIC附加索引檔26DIALOG—MathSCi索引典27ERIC--OCLC28ERIC–EBSCO29ERIC–ProQuest30數(shù)據(jù)庫索引法常見索引法單字索引法(wordindexing)詞組索引法(phraseindexing)單字與詞組混合索引法(wordandphraseindexing)數(shù)字索引法(numericindexing)輔助索引法布林邏輯操作數(shù)(Booleanlogicoperator)切截法(truncation)相近操作數(shù)(proximityoperator)特定限制欄位檢索法檢索用法查證法31求全率v.s.求準率求全率recallratio成功檢索到相關(guān)資料的比率=求準率precisionratio沒有檢索到不相關(guān)文獻的比率=相關(guān)不相關(guān)總數(shù)檢出aba+b未檢出cdc+d總數(shù)a+cb+da+b+c+daa+baa+c32單字索引法(wordindexing)將欄位中所有可供檢索的字逐一索引,鍵入倒置檔通常用于主題相關(guān)欄位,以非控制詞匯表示如題名、摘要、全文剔除停用字(Stopword)DIALOG的停用字:as、and、by、for、from、of、the、to、with可透過后組合(post-coordination)方式,以布林邏輯操作數(shù)組合查詢theevaluationofdatabases
evaluation、databases33詞組索引法(phraseindexing)或稱復合語索引法以一個獨立款目為單位進行檢索,包含空白與標點符號作者、資料型態(tài)、期刊名稱、出版語言檢索者在檢索時,必須以系統(tǒng)制作時的著錄方式檢索,甚至所有的標點符號和空格都需一致,方能檢索到資料如Bush,GeorgeHerbertWalker34單字與詞組混合索引法(wordandphraseindexing)多出現(xiàn)于與主題標目相關(guān)欄位保有單字索引法的組合彈性和詞組索引法的精確檢索者知道控制語匯時
采用詞組檢索,以提高確性檢索者不知道控制語匯時
利用單字組合檢索,提高檢索的回現(xiàn)率35單字與詞組混合索引法(wordandphraseindexing)(cont.)檢索點較多,如consumerattitudes以單字索引法“consumer”、”attitudes”使用詞組索引法”consumerattitudes”使用混合索引法“consumer”、”attitudes”、“consumerattitudes”缺點為占用數(shù)據(jù)庫儲存空間36數(shù)字索引法(numericindexing)常用于欄位內(nèi)所包含的內(nèi)容均為數(shù)字時商情名錄數(shù)據(jù)庫之公司基本資料
公司資本額、人數(shù)、銷售數(shù)據(jù)統(tǒng)計數(shù)據(jù)庫可依據(jù)數(shù)字大小排列,進行各項排序、比較、計算37前組合索引v.s.后組合索引(1)前組合索引(pre-coordinateindexing),又通稱為非操作型索引(non-manipulateindexing)索引者,在索引階段即進行字詞組合的檢索方式紙本索引常用方法,并利用系統(tǒng)輪回法(systematicrotation)方式,將可能出現(xiàn)的詞匯列出38前組合索引v.s.后組合索引(2)后組合索引(post-coordinateindexing),又通稱為操作型索引(manipulateindexing)檢索者,在檢索階段自行組合字詞的檢索方式39前組合索引v.s.后組合索引(3)索引詞匯數(shù)據(jù)庫使用者檢索策略利用指導數(shù)據(jù)庫使用者檢索策略利用指導后組合前組合數(shù)據(jù)庫使用者檢索策略利用指導40布林邏輯--1ANDintersection交集ORunion集合NOTdifference差別ANDORNOT41布林邏輯--2優(yōu)先級括號優(yōu)先執(zhí)行NOTANDOR(catsORdogs)NOTpetscatsdogspets42括號優(yōu)先布林邏輯操作數(shù)的優(yōu)先級,一般而言,括號必須優(yōu)先執(zhí)行,如果沒有括號,則一般為NOT>AND>ORDialog:ss(catalogingorclassificationorindexing)andtheoryss(catalogingorclassificationorindexing)andtheory43切截法在設(shè)定字根后,加上各種特殊符合
”?”、”#”、”$”,則可檢索到全部字根相同的字范例librar?
horse??
librar???
?computer
wom?n
用于復合語欄位檢索更能彰顯其功能如Bush,GeorgeHerbertWalker可不必擔心標點符號或空格但若切截過廣,會檢索出許多不相關(guān)的資料44相近操作數(shù)w
限制單字出現(xiàn)的順序information(w)theoryn
不限制單字出現(xiàn)的順序,但利用阿拉伯數(shù)字限制二字之間的間隔Ronald(n)ReaganMarilyn(2n)Whitel
限制其前后字詞必須屬于同一個敘述語cancer(l)preventions
限制其前后字詞必須出現(xiàn)在同一個副欄位中information(w)theory優(yōu)先級:wnsl45相近操作數(shù)w主要功能在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年閩北職業(yè)技術(shù)學院高職單招職業(yè)適應(yīng)性考試參考題庫帶答案解析
- 2026年宿州職業(yè)技術(shù)學院高職單招職業(yè)適應(yīng)性測試備考題庫帶答案解析
- 2026年江蘇電子信息職業(yè)學院高職單招職業(yè)適應(yīng)性考試備考試題帶答案解析
- 2026年蘇州工藝美術(shù)職業(yè)技術(shù)學院高職單招職業(yè)適應(yīng)性考試備考題庫帶答案解析
- 2026年浙江長征職業(yè)技術(shù)學院單招職業(yè)技能考試備考試題帶答案解析
- 2026 年高職醫(yī)學影像技術(shù)(影像設(shè)備維護)試題及答案
- 電子云與原子軌道課件-高二上學期化學人教版選擇性必修-
- 計算機板級維修工崗前技術(shù)實務(wù)考核試卷含答案
- 網(wǎng)絡(luò)與信息安全管理員操作管理測試考核試卷含答案
- 虎牙戶外協(xié)議書人氣
- 全球AI應(yīng)用平臺市場全景圖與趨勢洞察報告
- 2026.05.01施行的中華人民共和國漁業(yè)法(2025修訂)課件
- 維持性血液透析患者管理
- 2025年大學大四(臨床診斷學)癥狀鑒別診斷試題及答案
- 2026液態(tài)氧儲罐泄漏事故應(yīng)急處置方案
- 直腸解剖課件
- 2025年消控員初級證試題及答案
- 遼寧省丹東市鳳城市2024-2025學年八年級上學期1月期末語文試題
- 基于PLC控制的小型鉆床機械設(shè)計
- DB11T 290-2005山區(qū)生態(tài)公益林撫育技術(shù)規(guī)程
- 開放大學(原電視大學)行政管理實務(wù)期末復習資料所有單
評論
0/150
提交評論