企業(yè)信息化-數(shù)據(jù)管理_第1頁
企業(yè)信息化-數(shù)據(jù)管理_第2頁
企業(yè)信息化-數(shù)據(jù)管理_第3頁
企業(yè)信息化-數(shù)據(jù)管理_第4頁
企業(yè)信息化-數(shù)據(jù)管理_第5頁
免費預(yù)覽已結(jié)束,剩余8頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)管理數(shù)據(jù)管理包括數(shù)據(jù)的存儲、檢索和操縱。為了能夠在系統(tǒng)開發(fā)和開展業(yè)務(wù)工作期間有效地與信息服務(wù)人員進行聯(lián)系,用戶管理人員應(yīng)具備本章中所提到的有關(guān)概念、方法和術(shù)語方面的業(yè)務(wù)知識。一、數(shù)據(jù)和信息計算機系統(tǒng)并不存儲信息,只存儲數(shù)據(jù)。數(shù)據(jù)是獲得信息的原始材料,為了滿足定期存取的需要,它們被存儲在二級(輔助)存儲設(shè)備(磁盤和磁帶)上。信息是經(jīng)過同化、聚合和加工”后的有特定含義的數(shù)據(jù)。為了突擊數(shù)據(jù)和信息之間的差別,我們考察下面的例子。一個部門領(lǐng)導(dǎo)要求每個職工分別在一張紙上寫下他們的年齡。每張紙只有一行含義簡單的數(shù)據(jù)。然而經(jīng)理可以從這些數(shù)據(jù)中獲得信息。他能夠以此確定超過50歲的職工有多少、職工平均年齡是多

2、少,最年輕的職工年齡是多少等等。人們經(jīng)常使用彳言息處理”這個詞匯容易造成誤解,實際上,它的真正含義是為了產(chǎn)生信息而處理數(shù)據(jù)。二、數(shù)據(jù)組織的層次體系任何信息系統(tǒng)都有一個數(shù)據(jù)組織的層次體系。在該層次體系中,每一后繼層都是其前驅(qū)層數(shù)據(jù)元組合的結(jié)果,最終實現(xiàn)一個綜合的數(shù)據(jù)庫。處于第一層的位”用戶是不必了解的,而其它五層則是用戶輸入和請求數(shù)據(jù)時合理的需要。數(shù)據(jù)是一切信息系統(tǒng)的基礎(chǔ)。一個高質(zhì)量的計算機信息系統(tǒng)的最終用戶必須具備數(shù)據(jù)的組織及其處理方面的知識。?位位是主存儲器和輔助存儲器的基本單位。計算機是電子的,因而只能實現(xiàn)兩種狀態(tài)。從物理上講,可以通過不同途徑來實現(xiàn)這兩種狀態(tài)(電流的方向,開關(guān),涂在帶上和

3、盤上的鐵濕氧的磁性排列)。由于每一位只能表示兩種狀態(tài),因此,必須將位組合才能形成字母數(shù)字字符。由位組合成的字母數(shù)字字符被暫時存放在主存儲器中,或永久地存放在輔助存儲器中。在主存和輔存中存放的是字母數(shù)字字符的內(nèi)部表示形式(例如,如果采用EBC-DIC編碼體制,則11000010表示字母A,而11110001表示數(shù)字1)。在輸入時,對字母數(shù)字字符進行編碼以形成若干位的組合,而在輸出時進行譯碼。目前還沒有工業(yè)標準的編碼體制。最為流行的編碼體制是六位二進制編碼的十進制碼(BCD),七位ASCII碼以及八位擴充二進制編碼的十進制交換碼(EBCDIC-發(fā)音為eb-se-dik)。六位編碼最多可以表示64個

4、字符(2?6)。七位編碼可以表示128個字符,而八位編碼可以表示256個字符。讀者可能會問:既然用六位就可以對一個字符編碼。為什么還要用八位來編碼?這是因為六位碼的64種可能的組合只夠表示字母、數(shù)字和18個特殊符號。如果希望有表示大寫和小寫字母,那么六位編碼就不夠用了。因此,就需要具有128種組合的七位編碼。目前還難以想象出對128種以上的位的組合需要。引進八位編碼體制(EBCDIC)是為了利用這一個事實,即只用4位(24-具有16種可能的組合)來表示一個數(shù)值數(shù)據(jù)。因此,一個8位的編碼實際上可以用來表示兩個十進制數(shù)字。由于所存儲的數(shù)據(jù)多數(shù)是數(shù)值數(shù)據(jù),所以將兩個數(shù)字的編碼壓縮成八位可以節(jié)省存儲空

5、間。EBCDIC的8位組合稱之為一個字節(jié)。而BCD勺六位就構(gòu)成一個字節(jié)。在BCD口ASCII編碼體制中,字節(jié)是字符的同義詞。在EBCDIC編碼體制中,由于可以將兩個數(shù)字壓縮到一個字節(jié)中,所以EBCDIC的字節(jié)與字符間并不一一對應(yīng)。然而,在涉及到存儲容量時,則經(jīng)常交替地使用字符和字節(jié)。一個磁盤組可以有800兆字節(jié)容量(即800兆字節(jié)的永久存儲器),而一臺計算機的主存可以有8兆字節(jié)(作為處理用的兆字節(jié)的高速臨時存儲器)。較小的存儲設(shè)備用千字節(jié)(一千個字節(jié)的倍數(shù)來度量)。通常將兆和千分別縮寫M'和K'。在邏輯上講,一個EBCDIC字節(jié)是8位,而實際上它有9位。由于要將這些位在計算機和

6、外部設(shè)備(或遠程終端)之間傳送,所以在計算機硬件中使用了一種內(nèi)部校驗方法來保證傳送數(shù)據(jù)的準確性。這種構(gòu)驗方法之一是給傳送的數(shù)據(jù)附加一位奇偶校驗位,用該位來發(fā)現(xiàn)在傳送過程中是否丟失了一位。計算機可以采用偶數(shù)奇偶校驗或奇數(shù)奇偶校驗法,即每一字符要包含偶數(shù)個或奇數(shù)個開狀態(tài)”位。假定某臺計算機采用偶數(shù)奇偶校驗法,如果要將一個EBCDIC的字母A(它具有奇數(shù)個殲”位-11000001)寫到磁帶上,那么在傳送之前為了維持偶校驗,則需要增加一位奇偶位(即:111000001T禺數(shù)個開”位),在將字符寫到磁帶之前,硬件自動計算開”位的個數(shù)。如果計算機結(jié)果是奇數(shù),則說明已經(jīng)出現(xiàn)了奇偶校驗錯誤,計算機自動向操作員

7、發(fā)出警告。?字符(字節(jié))在通過鍵盤(光符號識別器或其他輸入設(shè)備)輸入一個字符時,機器直接將字符翻譯成某特定的編碼系統(tǒng)中一串位的組合。一個計算機系統(tǒng)可以使用不止一種編碼體制。例如,某些計算機系統(tǒng)中將ASCII編碼體制用于數(shù)據(jù)通信,而將EBCDIC編碼體制用于數(shù)據(jù)存儲。?數(shù)據(jù)元描述數(shù)據(jù)元的最好辦法是舉例說明。一個人的社會保險號、姓名、信用卡號、街道地址和婚姻狀況等都是數(shù)據(jù)元。在數(shù)據(jù)的層次體系中,數(shù)據(jù)元是最低一層的邏輯單位,為了形成一個邏輯單位,需要將若干位和若干字節(jié)組合在一起。一個日期不一定是一個數(shù)據(jù)元,它可以是三個數(shù)據(jù)元:年、月、日。對地址來說,也是同樣的。一個地址中可以包括州、城市、街道地址和

8、郵政碼這四個數(shù)據(jù)元。從邏輯上可以把日期和地址都看成是一個數(shù)據(jù)元,但是輸出這種數(shù)據(jù)元是不方便的。例如,通常在輸出時總是把街道地址單寫一行,因而應(yīng)該把一個地址的幾個數(shù)據(jù)元分開。此外,由于姓名和地址文件經(jīng)常按郵政碼排序,因此,需要將郵政碼作為一個邏輯實體(數(shù)據(jù)元)來對待。根據(jù)上下文的需要,有時也把數(shù)據(jù)元稱作為字段(記錄中的字段)。數(shù)據(jù)元是泛指的,而數(shù)據(jù)項才是實際的實體(或?qū)嶋H的彳直”)。例如,社會保險號是一個數(shù)據(jù)元,而445487279和44214158則是兩個數(shù)據(jù)項。為了節(jié)省輸入數(shù)據(jù)時敲打鍵盤的時間和存儲空間,在輸入數(shù)據(jù)時通常將數(shù)據(jù)元編碼。例如,通常將職工主文件中的性別”數(shù)據(jù)元編碼,這樣,數(shù)據(jù)錄入

9、員就可以簡單的輸入M或F'來代替Male”(男)或Female”(女)。在輸出時再將M'和F”分別翻譯成明”或女”。在設(shè)計數(shù)據(jù)元時,可以使一個數(shù)據(jù)項(如帳號)的編碼具有特定的含義,從而可以向用戶提供信息。例如,可以將一個大學(xué)的六位帳號編碼如下:表20.6.1宇桂/我字描述二般的戟食的研究的生物學(xué)土木工程化學(xué)T卷.電子工程美術(shù)動物學(xué)唯一數(shù)值的取目麻流特舉一個例子,RBI001將表示生物系的1另研究項目的帳號。?記錄將邏輯上相關(guān)的數(shù)據(jù)元組合在一起就形成一個記錄。表20.6.2列舉了一個職工記錄中可能包含的若干數(shù)據(jù)元,以及作為職工記錄的一個值的若干數(shù)據(jù)項。記錄是能夠從數(shù)據(jù)庫1存取的最

10、低一層的邏輯單位。例如,如果一個人事經(jīng)理需要知道阿溫肥訪苓溝幕橐賞純解桶間嘀用鍬即加嬤廊.崔床出偷行唯娼寫怒£ft20.6.2一個職工記錄數(shù)據(jù)元熟據(jù)飛朝工,社含保檢號445447279姓SMnn名al老字首字怦E-門(圖)ACTM卓娟狀況S工舞毋甩)600.00?文件文件是邏輯上相關(guān)的記錄的集合。職工主文件包含每一個職工的記錄。庫存文件包含每一種庫存貨物的記錄。應(yīng)收帳目文件包含每個顧客的記錄。父件”這個詞有時也指某臺二級存儲設(shè)備上的一塊已命名的區(qū)域,該區(qū)域中可以包含程序代碼、教材、數(shù)據(jù),甚至還可以包含輸出報表。?數(shù)據(jù)庫數(shù)據(jù)庫是一種作為計算機系統(tǒng)資源共享的全部數(shù)據(jù)之集合。有時根據(jù)不同應(yīng)

11、用領(lǐng)域可將該資源共享數(shù)據(jù)分成若干段。例如,財會數(shù)據(jù)庫可以劃分為一個應(yīng)用領(lǐng)域,它可以包含六個不同的文件。讀者應(yīng)該注意到:用父件”來組織數(shù)據(jù)這種方法將帶來數(shù)據(jù)的冗余。也就是說,為了在處理時使用,必須將某些數(shù)據(jù)元重復(fù)地存放在幾個文件中。例如,在一所大學(xué)的安置辦公室、宿舍管理處、財務(wù)支持辦公室以及注冊處等都有可能保存學(xué)生文件。像學(xué)生名、校內(nèi)地址這類數(shù)據(jù)元幾乎在每個文件中都重復(fù)出現(xiàn)。在對開發(fā)一個綜合的學(xué)生信息系統(tǒng)進行可行性分析時,一些系統(tǒng)分析員在美國西南部一所規(guī)模很大的大學(xué)中發(fā)現(xiàn)有75個計算機文件中都包含學(xué)生名和校內(nèi)地址。采用先進的數(shù)據(jù)庫管理系統(tǒng)比之傳統(tǒng)的文件系統(tǒng)有較大的改進,它使得用戶可以將存儲數(shù)據(jù)的

12、重復(fù)程度減至最小。三、數(shù)據(jù)庫的概念與用途?數(shù)據(jù)庫的概念什么是數(shù)據(jù)庫呢?當人們從不同的角度來描述這一概念時就有不同的定義(當然是描述性的)。例如,稱數(shù)據(jù)庫是一個記錄保存系統(tǒng)”(該定義強調(diào)了數(shù)據(jù)庫是若干記錄的集合)。又如稱數(shù)據(jù)庫是人們?yōu)榻鉀Q特定的任務(wù),以一定的組織方式存儲在一起的相關(guān)的數(shù)據(jù)的集合”(該定義側(cè)重于數(shù)據(jù)的組織)。更有甚者稱數(shù)據(jù)庫是個數(shù)據(jù)倉庫”。當然,這種說法雖然形象,但并不嚴謹。嚴格地說,數(shù)據(jù)庫是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫在經(jīng)濟管理的日常工作中,常常需要把某些相關(guān)的數(shù)據(jù)放進這樣倉庫”,并根據(jù)管理的需要進行相應(yīng)的處理。例如,企業(yè)或事業(yè)單位的人事部門常常要把本單位職工的基本情

13、況(職工號、姓名、年齡、性別、籍貫、工資、簡歷等)存放在表20.6.3中,這張表就可以看成是一個數(shù)據(jù)庫。有了這個數(shù)據(jù)倉庫”我們就可以根據(jù)需要隨時查詢某職工的基本情況,也可以查詢工資在某個范圍內(nèi)的職工人數(shù)等等。這些工作如果都能在計算機上自動進行,那我們的人事管理就可以達到極高的水平。此外,在財務(wù)管理、倉庫管理、生產(chǎn)管理中也需要建立眾多的這種數(shù)據(jù)庫”,使其可以利用計算機實現(xiàn)財務(wù)、倉庫、生產(chǎn)的自動化管理。J.Martin給數(shù)據(jù)庫下了一個比較完整的定義:數(shù)據(jù)庫是存儲在一起的相關(guān)數(shù)據(jù)的集合,這些數(shù)據(jù)是結(jié)構(gòu)化的,無有害的或不必要的冗余,并為多種應(yīng)用服務(wù);數(shù)據(jù)的存儲獨立于使用它的程序;對數(shù)據(jù)庫插入新數(shù)據(jù),修

14、改和檢索原有數(shù)據(jù)均能按一種公用的和可控制的方式進行。當某個系統(tǒng)中存在結(jié)構(gòu)上完全分開的若干個數(shù)據(jù)庫時,則該系統(tǒng)包含一個數(shù)據(jù)庫集合”。?數(shù)據(jù)庫的優(yōu)點量2O&3人事基本檔案工號姓名性制年齡瞥遇斷而明手叼25重度870002王崗r刃拓87/0003李一女然JtJft/0QQ4林立文3091/0005陳忐明35102/使用數(shù)據(jù)庫可以帶來許多好處:如減少了數(shù)據(jù)的冗余度,從而大大地節(jié)省了數(shù)據(jù)的存儲空間;實現(xiàn)數(shù)據(jù)資源的充分共享等等。此外,數(shù)據(jù)庫技術(shù)還為用戶提供了非常簡便的使用手段使用戶易于編寫有關(guān)數(shù)據(jù)庫應(yīng)用程序。特別是近年來推出的微型計算機關(guān)系數(shù)據(jù)庫管理系統(tǒng)dBASELL操作直觀,使用靈活,編程方便,

15、環(huán)境適應(yīng)廣泛(一般的十六位機,如舊M/PC/XT,國產(chǎn)長城0520等均可運行種軟件),數(shù)據(jù)處理能力極強。數(shù)據(jù)庫在我國正得到愈來愈廣泛的應(yīng)用,必將成為經(jīng)濟管理的有力工具。數(shù)據(jù)庫是通過數(shù)據(jù)庫管理系統(tǒng)(DBMS-DATABASEMANAGEMENTSYSTEM)來實現(xiàn)數(shù)據(jù)的存儲、管理與使用的dBASELLM是一種數(shù)據(jù)庫管理系統(tǒng)軟件。?數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)庫種類數(shù)據(jù)庫通常分為層次式數(shù)據(jù)庫、網(wǎng)絡(luò)式數(shù)據(jù)庫和關(guān)系式數(shù)據(jù)庫三種。而不同的數(shù)據(jù)庫是按不同的數(shù)據(jù)結(jié)構(gòu)來聯(lián)系和組織的。1.數(shù)據(jù)結(jié)構(gòu)模型(1) 數(shù)據(jù)結(jié)構(gòu)所謂數(shù)據(jù)結(jié)構(gòu)是指數(shù)據(jù)的組織形式或數(shù)據(jù)之間的聯(lián)系。如果用D表示數(shù)據(jù),用R表示數(shù)據(jù)對象之間存在的關(guān)系集合,則將D

16、S=(D,R)稱為數(shù)據(jù)結(jié)構(gòu)。例如,設(shè)有一個電話號碼簿,它記錄了n個人的名字和相應(yīng)的電話號碼。為了方便地查找某人的電話號碼,將人名和號碼按字典順序排列,并在名字的后面跟隨著對應(yīng)的電話號碼。這樣,若要查找某人的電話號碼(假定他的名字的第一個字母是Y),那么只須查找以Y開頭的那些名字就可以了。該例中,數(shù)據(jù)的集合D就是人名和電話號碼,它們之間的聯(lián)系R就是按字典順序的排列,其相應(yīng)的數(shù)據(jù)結(jié)構(gòu)就是DS=(D,R),即一個數(shù)組。(2) 數(shù)據(jù)結(jié)構(gòu)種類數(shù)據(jù)結(jié)構(gòu)又分為數(shù)據(jù)的邏輯結(jié)構(gòu)和數(shù)據(jù)的物理結(jié)構(gòu)。數(shù)據(jù)的邏輯結(jié)構(gòu)是從邏輯的角度(即數(shù)據(jù)間的聯(lián)系和組織方式)來觀察數(shù)據(jù),分析數(shù)據(jù),與數(shù)據(jù)的存儲位置無關(guān)。數(shù)據(jù)的物理結(jié)構(gòu)是指

17、數(shù)據(jù)在計算機中存放的結(jié)構(gòu),即數(shù)據(jù)的邏輯結(jié)構(gòu)在計算機中的實現(xiàn)形式,所以物理結(jié)構(gòu)也被稱為存儲結(jié)構(gòu)。本節(jié)只研究數(shù)據(jù)的邏輯結(jié)構(gòu),并將反映和實現(xiàn)數(shù)據(jù)聯(lián)系的方法稱為數(shù)據(jù)模型。目前,比較流行的數(shù)據(jù)模型有三種,即按圖論理論建立的層次結(jié)構(gòu)模型和網(wǎng)狀結(jié)構(gòu)模型以及按關(guān)系理論建立的關(guān)系結(jié)構(gòu)模型。(3) 次、網(wǎng)狀和關(guān)系數(shù)據(jù)庫系統(tǒng)(1) 層次結(jié)構(gòu)模型層次結(jié)構(gòu)模型實質(zhì)上是一種有根結(jié)點的定向有序樹(在數(shù)學(xué)中樹”被定義為一個無回的連通圖)。例如圖20.6.4是一個高等學(xué)校的組織結(jié)構(gòu)圖。這個組織結(jié)構(gòu)圖像一棵樹,校部就是樹根(稱為根結(jié)點),各系、專業(yè)、教師、學(xué)生等為枝點(稱為結(jié)點),樹根與枝點之間的聯(lián)系稱為邊,樹根與邊之比為1:N

18、,即樹根只有一個,樹枝有N個。這種數(shù)據(jù)結(jié)構(gòu)模型的一般結(jié)構(gòu)見圖20.6.5所示。圖20.6.4高等學(xué)校的組織結(jié)構(gòu)圖圖20.6.5層次結(jié)構(gòu)模型圖20.6.5中,Ri(i=1,2,-6)代表記錄(即數(shù)據(jù)的集合),其中R1就是根結(jié)點(如果Ri看成是一個家族,則R1就是祖先,它是R2、R&R4的雙親,而R2、R3>R4互為兄弟),RSR6也是兄弟,且其雙親為R3。R2、R4>RSR6又被稱為葉結(jié)點(即無子女的結(jié)點)。這樣,Ri(i=1,2,-6)就組成了以R1為樹根的一棵樹,這就是一個層次數(shù)據(jù)結(jié)構(gòu)模型。按照層次模型建立的數(shù)據(jù)庫系統(tǒng)稱為層次模型數(shù)據(jù)庫系統(tǒng)。IMS(Information

19、Manage-mentSystem)是其典型代表。(2) 網(wǎng)狀結(jié)構(gòu)模型?在圖20.6.6中,給出了某醫(yī)院醫(yī)生、病房和病人之間的聯(lián)系。即每個醫(yī)生負責(zé)治療三個病人,每個病房可住一到四個病人。如果將醫(yī)生看成是一個數(shù)據(jù)集合,病人和病房分別是另外兩個數(shù)據(jù)集合,那么醫(yī)生、病人和病房的比例關(guān)系就是M:N:P(即M個醫(yī)生,N個病人,P間病房)。這種數(shù)據(jù)結(jié)構(gòu)就是網(wǎng)狀數(shù)據(jù)結(jié)構(gòu),它的一般結(jié)構(gòu)模型如圖20.6.7所示。在圖中,記錄Ri(i=1,2,8)滿足以下條件:可以有一個以上的結(jié)點無雙親(如R1、R2、R3)。至少有一個結(jié)點有多于一個以上的雙親。在醫(yī)生、病人、病房“例中,醫(yī)生集合有若干個結(jié)點(M個醫(yī)生結(jié)點)無雙親

20、”,而病房”集合有P個結(jié)點(即病房),并有一個以上的雙親"(即病人)。圖20.6.6醫(yī)生、病房和病人之間的關(guān)系圖20.6.7網(wǎng)狀結(jié)構(gòu)模型按照網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)建立的數(shù)據(jù)庫系統(tǒng)稱為網(wǎng)狀數(shù)據(jù)庫系統(tǒng),其典型代表是DBTG(DataBaseTaskGroup)。用數(shù)學(xué)方法可將網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化為層次數(shù)據(jù)結(jié)構(gòu)。(3) 關(guān)系結(jié)構(gòu)模型關(guān)系式數(shù)據(jù)結(jié)構(gòu)把一些復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸結(jié)為簡單的二元關(guān)系(即二維表格形式)。例如某單位的職工關(guān)系就是一個二元關(guān)系(見表20.6.8)。這個四行六列的表格的每一列稱為一個字段(即屬性),字段名相當于標題欄中的標題(屬性名稱);表的每一行是包含了六個屬性(工號、姓名、年齡、性別、職

21、務(wù)、工資)的一個六元組,即一個人的記錄。這個表格清晰地反映出該單位職工的基本情況。表20.6.8職工基本情況工號姓名異齡性劇做勢工索moi先空光女科已78OOOQ不現(xiàn)弱副科長910003王本»理姓松1L9費20件9二維表格舉的A%即ii<bVnvHVBr%VuBIEKlip'、1.VbiVdV.通常一個mfi1、n列的二維表格的結(jié)構(gòu)如表20.6.9所示。表中每一行表示一個記錄值,每一列表示一個屬性(即字段或數(shù)據(jù)項)。該表一共有m個記錄。每個記錄包含n個屬性。作為一個關(guān)系的二維表,必須滿足以下條件:(1) 表中每一列必須是基本數(shù)據(jù)項(即不可再分解)。(2) 表中每一列必須

22、具有相同的數(shù)據(jù)類型(例如字符型或數(shù)值型)。(3) 表中每一列的名字必須是唯一的。(4) 表中不應(yīng)有內(nèi)容完全相同的行。(5) 行的順序與列的順序不影響表格中所表示的信息的含義。由關(guān)系數(shù)據(jù)結(jié)構(gòu)組成的數(shù)據(jù)庫系統(tǒng)被稱為關(guān)系數(shù)據(jù)庫系統(tǒng)。在關(guān)系數(shù)據(jù)庫中,對數(shù)據(jù)的操作幾乎全部建立在一個或多個關(guān)系表格上,通過對這些關(guān)系表格的分類、合并、連接或選取等運算來實現(xiàn)數(shù)據(jù)的管理。dBASEII就是這類數(shù)據(jù)庫管理系統(tǒng)的典型代表。對于一個實際的應(yīng)用問題(如人事管理問題),有時需要多個關(guān)系才能實現(xiàn)。用dBASEII建立起來的一個關(guān)系稱為一個數(shù)據(jù)庫(或稱數(shù)據(jù)庫文件),而把對應(yīng)多個關(guān)系建立起來的多個數(shù)據(jù)庫稱為數(shù)據(jù)庫系統(tǒng)。dBAS

23、EII的另一個重要功能是通過建立命令文件來實現(xiàn)對數(shù)據(jù)庫的使用和管理,對于一個數(shù)據(jù)庫系統(tǒng)相應(yīng)的命令序列文件,稱為該數(shù)據(jù)庫的應(yīng)用系統(tǒng)。因此,可以概括地說,一個關(guān)系稱為一個數(shù)據(jù)庫,若干個數(shù)據(jù)庫可以構(gòu)成一個數(shù)據(jù)庫系統(tǒng)。數(shù)據(jù)庫系統(tǒng)可以派生出各種不同類型的輔助文件和建立它的應(yīng)用系統(tǒng)。?數(shù)據(jù)庫的要求與特性為了使各種類型的數(shù)據(jù)庫系統(tǒng)能夠充分發(fā)揮它們的優(yōu)越性,必須對數(shù)據(jù)庫管理系統(tǒng)的使用提出一些明確的要求。1. 建立數(shù)據(jù)庫文件的要求(1) 盡量減少數(shù)據(jù)的重復(fù),使數(shù)據(jù)具有最小的冗余度。計算機早期應(yīng)用中的文件管理系統(tǒng),由于數(shù)據(jù)文件是用戶各自建立的,幾個用戶即使有許多相同的數(shù)據(jù)也得放在各自的文件中,因而造成存儲的數(shù)據(jù)大

24、量重復(fù),浪費存儲空間。數(shù)據(jù)庫技術(shù)正是為了克服這一缺點而出現(xiàn)的,所以在組織數(shù)據(jù)的存儲時應(yīng)避免出現(xiàn)冗余。(2) 提高數(shù)據(jù)的利用率,使眾多用戶都能共享數(shù)據(jù)資源。(3) 注意保持數(shù)據(jù)的完整性。這對某些需要歷史數(shù)據(jù)來進行預(yù)測、決策的部門(如統(tǒng)計局、銀行等)特別重要。(4) 注意同一數(shù)據(jù)描述方法的一致性,使數(shù)據(jù)操作不致發(fā)生混亂。如一個人的學(xué)歷在人事檔案中是大學(xué)畢業(yè),而在科技檔案中卻是大學(xué)程度,這樣就容易造成混亂。(5) 對于某些需要保密的數(shù)據(jù),必須增設(shè)保密措施。(6) 數(shù)據(jù)的查找率高,根據(jù)需要數(shù)據(jù)應(yīng)能被及時維護。2. 數(shù)據(jù)庫文件的特征無論使用哪一種數(shù)據(jù)庫管理系統(tǒng),由它們所建立的數(shù)據(jù)庫文件都可以看成是具有相

25、同性質(zhì)的記錄的集合,因而這些數(shù)據(jù)庫文件都有相同的特性:(1) 文件的記錄格式相同,長度相等。(2) 不同的行是不同的記錄,因而具有不同的內(nèi)容。(3) 不同的列表示不同的字段名,同一列中的數(shù)據(jù)的性質(zhì)(屬性)相同。(4) 每一行各列的內(nèi)容是不能分割的,但行的順序和列的順序不影響文件內(nèi)容的表達。3. 文件的分類對文件引用最多的是主文件和事物文件。其他的文件分類還包括表文件、備份文件、檔案的輸出文件等。下面將講述這些文件。(1) 主文件。主文件是某特定應(yīng)用領(lǐng)域的永久性的數(shù)據(jù)資源。主文件包含那些被定期存取以提供信息和經(jīng)常更新以反映最新狀態(tài)的記錄。典型的主文件有庫存文件、職工主文件和收帳主文件等。(2)

26、事務(wù)文件。事務(wù)文件包含著作為一個信息系統(tǒng)的數(shù)據(jù)活動(事務(wù))的那些記錄。這些事務(wù)被分批以構(gòu)成事務(wù)文件。例如,從每周工資卡上錄制下來的數(shù)分批存放在一個事務(wù)文件上,然后對照工資清單文件進行處理以便打印出工資支票和工資記錄簿。(3) 表文件。表文件是一些表格。之所以單獨建立表文件而不把表設(shè)計在程序中是為了便于修改。例如,一個公用事業(yè)公司的稅率表或國內(nèi)稅務(wù)局的稅率就可以存儲在表中文件。(4) 備用文件。備用文件是現(xiàn)有生產(chǎn)性文件的一個復(fù)制品。一旦生產(chǎn)性文件受到破壞,利用備用文件就可以重新建立生產(chǎn)性文件。(5) 檔案文件。檔案文件不是提供當前處理使用的,而是保存起來作為歷史參照的。例如,國內(nèi)稅務(wù)局(IRS)

27、可能要求檢查某個人最近15年的歷史。實際上,檔案文件恰恰是在給定時間內(nèi)工作的一個“快照”。(6) 輸出文件。輸出文件包含將要打印在打印機上的、顯在屏幕上的或者繪制在繪圖儀上的那些信息的數(shù)值映象。輸出文件可以是“假脫機的”(存儲在輔存設(shè)備上),當輸出設(shè)備可用時才進行實際的輸出。四、數(shù)據(jù)的操縱和檢索綜合數(shù)據(jù)庫管理系統(tǒng)到目前為止,我們集中討論了傳統(tǒng)的文件處理。此處,文件是作為一個獨立的邏輯實體來處理的,而且通常與某個特定的業(yè)務(wù)領(lǐng)域相聯(lián)系。為了把業(yè)務(wù)上相近的那些部門的文件綜合在一起,必須預(yù)先排序記錄和合并文件。這樣做可能耗費大量的時間,有時甚至是不可能實現(xiàn)的。通常,文件是為了滿足特定業(yè)務(wù)領(lǐng)域某部門的專

28、門需要而設(shè)計的,如果某部門想使用保存在一個文件上的部分數(shù)據(jù),而該文件是另一部門為自己使用而設(shè)計的,那么他們必須抽取這些數(shù)據(jù)并重新整理后才能使用。大多數(shù)部門總是寧愿建立和保持和一個類似(而不同)的文件以更好地滿足自己的使用要求,而不愿兼顧其他部門的業(yè)務(wù)需要。這樣做的結(jié)果形成了大量的帶有重復(fù)數(shù)據(jù)的文件。前面的例子中已經(jīng)提到,某所大學(xué)就保存了75個獨立的計算機文件,而每個文件中都包含有學(xué)生記錄。每當一個學(xué)生結(jié)婚了或者改換了住處時,則必須修改75個文件。數(shù)據(jù)的冗余會使成本提高,而設(shè)計一個綜合的資源共享數(shù)據(jù)庫則可以把數(shù)據(jù)冗余度降低到最小程度。綜合的資源共享數(shù)據(jù)庫把公司看作一個整體來提供服務(wù),而不只是為公

29、司某特殊部門服務(wù)。利用數(shù)據(jù)庫管理系統(tǒng)(DBMS欹件就可能實現(xiàn)一個綜合的數(shù)據(jù)庫。早在70年代初期就出現(xiàn)了DBM豉術(shù),但是直到70年代末期仍未得到普遍的接受。早期的DBMS“軟件包”效率不高,實際上比傳統(tǒng)的文件處理的要求更高的硬件能力。目前DBMS對硬件的要求已經(jīng)降低了,甚至在小型計算機系統(tǒng)上也能運行DBM歆件,造成推遲接受和實現(xiàn)DBM豉術(shù)的主要原因可能是信息服務(wù)人員缺乏專門的知識,而且用戶管理人員又不愿合作和支持建立一個共享的數(shù)據(jù)庫。目前對于設(shè)計和運行DBM漱件已經(jīng)有了廣泛的了解,而且部分用戶管理人員已經(jīng)認識到應(yīng)該把信息作為一個公司的資源來看待。?數(shù)據(jù)庫環(huán)境的好處1 .經(jīng)濟上的好處。通過先進的數(shù)

30、據(jù)結(jié)構(gòu)技術(shù),DBMS供了最小化數(shù)據(jù)冗余度的可能性。當然,為了提高處理效率,即使有了DBM卵助,有時還需要在共享的數(shù)據(jù)庫中保留一定的重復(fù)數(shù)據(jù)。由于減少了數(shù)據(jù)的冗余度,從而也簡化了收集和更新數(shù)據(jù)的過程。就前面的例子而言,只需要在一處(數(shù)據(jù)庫中)更新學(xué)生地址就可以了。2 .數(shù)據(jù)庫技術(shù)也給信息服務(wù)專業(yè)人員帶來的好處。綜合資源共享數(shù)據(jù)庫為系統(tǒng)分析員打開了嶄新的大門。數(shù)據(jù)庫能向系統(tǒng)分析員提供傳統(tǒng)文件所不能提供的信息。由于有了DBMS就更容易得到數(shù)據(jù),因此使程序設(shè)計任務(wù)要比原先更為簡單。此外,數(shù)據(jù)是獨立于程序的。這意味著用戶管理人員可以增加數(shù)據(jù)庫中的數(shù)據(jù)、修改庫中的現(xiàn)有數(shù)據(jù)或者從庫中刪除數(shù)據(jù),這些并不影響現(xiàn)

31、有的程序,而在過去則需要測試和修改幾十個(有時幾百個)程序。當然,數(shù)據(jù)庫管理系統(tǒng)還有其它重要的優(yōu)點,但是這些已超出本書的范圍。3 .信息方面的好處。一個綜合資源共享數(shù)據(jù)庫能以有序的方式提供一種滿足信息要求的結(jié)構(gòu)。實際上,數(shù)據(jù)庫是能夠充分利用公司信息資源的唯一工具。由于數(shù)據(jù)庫和DBMSE產(chǎn)生報表方面提供了極大的靈活性,因此,也給決策過程帶來了同樣的靈活性。4 .DBMS軟件在支持聯(lián)機系統(tǒng)方面是特別有價值的。共享數(shù)據(jù)庫不僅可供多個用戶存取而且還特別能反映出數(shù)據(jù)的當前狀態(tài)。對于許多查詢來說,及時性是很關(guān)鍵的。例如,某個經(jīng)理由于設(shè)備故障不得不關(guān)閉某個工作站,此時他有可能要查詢其它工作站的狀態(tài),并且利用

32、得到的信息來改變進行中的工作路線。?方法DBMS克服了傳統(tǒng)文件處理的局限性。它依靠靈活多變的數(shù)據(jù)結(jié)構(gòu)(將數(shù)據(jù)元及記錄彼此聯(lián)系的方法)來做到這一點?;诓煌瑪?shù)據(jù)結(jié)構(gòu)的DBMSi間差別很大。有三種設(shè)計DBM歌件的方法1.數(shù)據(jù)系統(tǒng)語言會議(CODASYL段計并發(fā)布的基于網(wǎng)絡(luò)或叢形數(shù)據(jù)結(jié)構(gòu)的DBMS旨南。2.IBM的信息管理系統(tǒng)(IBS)使用的一種層次結(jié)構(gòu)。3.某些最近設(shè)計的基于關(guān)系數(shù)據(jù)結(jié)構(gòu)的DBMS。上述的每一種方法是基本概念和術(shù)語的差別都很大。因此,為了減少混淆和便于理解,以下的闡述和討論只使用網(wǎng)絡(luò)方法。?庫設(shè)計1.數(shù)據(jù)庫設(shè)計方法我們通過下面的例子來說明數(shù)據(jù)庫管理系統(tǒng)和一種數(shù)據(jù)庫設(shè)計方法的原理。考

33、察下述情況。某圖書館保存了一個文件,該文件每一個記錄都包含了下述數(shù)據(jù)元:(1) 書名(2) 作者(3) 出版社(4) 出版社地址(5) 類別(6) 出版年份圖書館館長希望在獲得決策信息方面有更多的靈活性。而現(xiàn)在文件不可能滿足其要求。經(jīng)過與信息處理人員交換意見之后,他們決定實現(xiàn)一個基于CODASY的數(shù)據(jù)庫管理系統(tǒng)。檢查現(xiàn)有文件發(fā)現(xiàn)某些數(shù)據(jù)重復(fù)出現(xiàn)。每本書(每一書名)都分別有一個記錄。于是,寫過幾本書的作者的名字在他寫的每本書的記錄中重復(fù)出現(xiàn)。在一個圖書館里可能有某出版社出版的數(shù)百本,甚至數(shù)千本書,但是在該文件的每本書的記錄中都重復(fù)地出現(xiàn)出版社名和出版社地址。2.設(shè)立數(shù)據(jù)庫的步驟設(shè)計數(shù)據(jù)庫的方法之

34、一是使用主題詞一屬性矩陣作為識別記錄和這些記錄之間關(guān)系的一個輔助工具。以下各步驟描述了這種設(shè)計數(shù)據(jù)庫的方法。第一步,在圖20.6.10的主題詞一屬性矩陣的左邊列出了邏輯主題詞。在本例中,這些主題詞是:書名、作者和出版社。在矩陣的頂端列出了所有可能的屬性。屬性是提供與主題詞有關(guān)的信息的任一數(shù)據(jù)元。(P71)圖20.6.10主題詞屬性矩陣第二步:在屬性與主題詞之間的關(guān)系有一對一的,一對多的或者不存在關(guān)系。例如,一特定書名只有一個出版社。所以在書名與出版社之間存在一對一的關(guān)系。然而,一個書名可以有幾個作者。因而,在書名與作者之間存在一對多的關(guān)系。在圖20.6.11中用”表示一對一關(guān)系,用M'

35、表示一對多關(guān)系,而且空白表示無關(guān)系存在。第三步:數(shù)據(jù)庫記錄類似于傳統(tǒng)文件的記錄,它是相關(guān)數(shù)據(jù)元的集合??梢詫⒂涗洀臄?shù)據(jù)庫中讀出來,也可以將記錄寫到數(shù)據(jù)庫中去。數(shù)據(jù)庫記錄也稱為節(jié)段。在這一步,用主題詞一屬性矩陣來標識記錄。這是通過列出與每個主題詞一對一關(guān)系的屬性來實現(xiàn)的。通常,對應(yīng)每個主題都有一個記錄,書名”記錄包含出版社、出版年份和類別,如下所示:書名三別.”出蔽年份S追出版社一:出版社地址為了稗數(shù)據(jù)冗余度減至最小.在記錄中將不包含一對部美系的腐性,而通過敷掘幫均來保KJiS些一對學(xué)的關(guān)系在推統(tǒng)的文件缽Etft中作否”數(shù)據(jù)元包含"書名"記錄中,如下所承;書名類髀出版年份作者

36、I作者2件者3作者4第四步:數(shù)據(jù)庫設(shè)計過程的下一步是建立記錄之間的關(guān)系。圖20.6.11給出主題一屬性矩陣中指出的一對多的關(guān)系。出版社與書名之間的一對多的關(guān)系是用兩個記錄之間的一條連線來指出的,該連線有一箭頭指向出版社記錄。指向書名記錄的兩個箭頭表示每個出版社可以有一個以上的書名。這種出版社一書名的組合稱之為一個系。其它的系是:書名-作者、作者-出版社、作者-書名和出版社T乍者。多對多的關(guān)系(每一端都有兩個箭頭)在處理時可能會引起混淆,因而是不允許的。圖30h.ll裁僵除圮錄之間的關(guān)系(F72)圖20.6.12一個完整的網(wǎng)絡(luò)模型第五步:下一步消去冗余的屬性和系。記住,我們的目的是將作者、書名和

37、出版社記錄輸入到數(shù)據(jù)庫,然后經(jīng)由系建立的聯(lián)系從不同的記錄中檢索數(shù)據(jù)。因此,必須消去對此目的是冗余的那些系。在本例中,顯而易見作者-出版社系或作者-書名系是冗余(重復(fù))的,由于作者與書名相匹配的機會比它與出版社匹配的機會多,因此應(yīng)該消去作者-出版社系。圖20.6.12給出了結(jié)果模式。該模式是數(shù)據(jù)庫邏輯結(jié)構(gòu)的一種圖式表示。現(xiàn)在圖書館館長可以進行如下的查詢:列出某作者寫的所有書的書名;按字母順序列出由Pientice-Hall在1981年出版的那些書的書名;列出1987年以來至少在三個出版社出版書的那些作者。該數(shù)據(jù)庫(正如所設(shè)計的那樣)很容易實現(xiàn)上述查詢及其它類似的查詢。對圖書館原有文件來說,類似的查詢不僅要求處理整個文件,而且可能還要處理好幾遍。有時,還要求對文件進行排序和合并。圈2O.&13地循峰造構(gòu)的一個值如果圖書館館長在一年之后決定需要另一個記錄或?qū)傩?,那么,?shù)據(jù)庫管理員(DBA)可以重新產(chǎn)生數(shù)據(jù)庫,增加屬性,甚至增加系而不影響現(xiàn)在的程序。圖20.6.13表示該模式,而圖20.6.13表示數(shù)據(jù)庫結(jié)構(gòu)的一個值。模式與值的關(guān)系類似于數(shù)據(jù)元與數(shù)據(jù)項的關(guān)系。一個是數(shù)據(jù)的定義,而另一個是實際的值或內(nèi)容。情感語錄1 .愛情合適就好,不要委屈將就,只要隨意,彼此之間不要太大壓力2 .時間會把最正確的人帶到你身邊,在此之前,你要做的,是好好的照顧

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論