第1章數(shù)據(jù)庫基礎(chǔ)知識_第1頁
第1章數(shù)據(jù)庫基礎(chǔ)知識_第2頁
第1章數(shù)據(jù)庫基礎(chǔ)知識_第3頁
第1章數(shù)據(jù)庫基礎(chǔ)知識_第4頁
第1章數(shù)據(jù)庫基礎(chǔ)知識_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1章數(shù)據(jù)庫基礎(chǔ)知識1.1數(shù)據(jù)庫基礎(chǔ)知識1.1.1相關(guān)術(shù)語1.數(shù)據(jù)從計算機角度看,數(shù)據(jù)是存儲在某種媒體上能被識別物理符號。包括兩方面的含義,一是描述事務(wù)特性的數(shù)據(jù)內(nèi)容;二是存儲在某一種媒體的數(shù)據(jù)形式。2.信息“信息”是指現(xiàn)實世界事物存在方式或運動狀態(tài)的反映。具體地說,信息是一種已經(jīng)被加工的特定形式的數(shù)據(jù),這種數(shù)據(jù)形式對接收者來說是很有意義的,而且對當前和將來的決策具有明顯的或?qū)嶋H的價值。3.數(shù)據(jù)與信息的聯(lián)系信息與數(shù)據(jù)是兩個既有聯(lián)系、又有區(qū)別的概念。數(shù)據(jù)是信息的載體,而信息是數(shù)據(jù)的內(nèi)涵。同一信息可以有不同的數(shù)據(jù)表示形式;而同一數(shù)據(jù)也有不同的解釋。例如:“張三很高”是信息,“張三的身高為2米”是數(shù)據(jù)。在計算機中,文字、圖形、圖像、聲音、動畫、影像等都是數(shù)據(jù)。4.數(shù)據(jù)處理數(shù)據(jù)處理也稱信息處理,就是將數(shù)據(jù)轉(zhuǎn)換成信息的過程。1.1.2計算機數(shù)據(jù)管理的發(fā)展階段1、人工管理階段20世紀50年代中期以前,計算機主要用于科學計算。那時的計算機硬件方面,外存只有卡片、紙帶和磁帶,沒有磁盤等直接存取的存儲設(shè)備;軟件方面,只有匯編語言,沒有操作系統(tǒng)和高級語言,更沒有管理數(shù)據(jù)的軟件;數(shù)據(jù)處理的方式是批處理。這些決定了當時的數(shù)據(jù)管理只能依賴人工來進行。特點:數(shù)據(jù)不保存,數(shù)據(jù)無專門軟件進行管理,數(shù)據(jù)不共享,不具有獨立性,數(shù)據(jù)無結(jié)構(gòu)。2、文件系統(tǒng)階段20世紀60年代,隨著科學技術(shù)的發(fā)展,計算機技術(shù)有了很大的提高,計算機的應(yīng)用范圍也不斷擴大,不僅用于科學計算,還大量用于管理。這時的計算機硬件已經(jīng)有了磁盤和磁鼓等直接存取的外存設(shè)備;軟件也有了操作系統(tǒng)、高級語言,操作系統(tǒng)中的文件系統(tǒng)是專門用于數(shù)據(jù)管理的軟件;處理方式不僅有批處理,還增加了聯(lián)機實時處理。特點:(1)數(shù)據(jù)可以長期保存在磁盤上。(2)數(shù)據(jù)有了一定的獨立性。(3)數(shù)據(jù)冗余量大。數(shù)據(jù)冗余是指不必要的重復(fù)存儲。在文件系統(tǒng)中,文件仍然是面對應(yīng)用的,一個文件基本上對應(yīng)于一個應(yīng)用程序。即使多個程序使用了一部分相同的數(shù)據(jù),也必須建立各自的文件,不能對數(shù)據(jù)項進行共享,因此數(shù)據(jù)冗余大,存儲空間浪費。(4)數(shù)據(jù)仍不能共享,文件之間缺乏聯(lián)系,相對孤立,仍然不能反映客觀世界各個事物之間錯綜復(fù)雜的聯(lián)系。3、數(shù)據(jù)庫系統(tǒng)階段20世紀60年代末以來,計算機的應(yīng)用更為廣泛,用于數(shù)據(jù)管理的規(guī)模也更為龐大,由此帶來數(shù)據(jù)量的急劇膨脹。計算機存儲技術(shù)有了很大發(fā)展,出現(xiàn)了大容量的磁盤。在處理方式上,聯(lián)機實時處理的要求更多。這種變化促使了數(shù)據(jù)管理手段的進步,數(shù)據(jù)庫技術(shù)應(yīng)運而生。數(shù)據(jù)庫系統(tǒng)的特點如下:(1)數(shù)據(jù)的結(jié)構(gòu)化(2)數(shù)據(jù)的共享性好(3)數(shù)據(jù)的獨立性好(4)數(shù)據(jù)的冗余量小4、分布式數(shù)據(jù)庫系統(tǒng)20世紀70年代后期之前,數(shù)據(jù)庫系統(tǒng)多數(shù)是集中式的。分布式數(shù)據(jù)庫系統(tǒng)是數(shù)據(jù)庫技術(shù)和計算機網(wǎng)絡(luò)技術(shù)相結(jié)合的產(chǎn)物,在80年代中期已有商品化產(chǎn)品問世。分布式數(shù)據(jù)庫是一個邏輯上統(tǒng)一、地域上分布的數(shù)據(jù)集合,是計算機網(wǎng)絡(luò)環(huán)境中各個結(jié)點局部數(shù)據(jù)庫的邏輯集合,同時受分布式數(shù)據(jù)庫管理系統(tǒng)的管理和控制。5、面向?qū)ο髷?shù)據(jù)庫系統(tǒng)

面向?qū)ο缶幊蹋∣bjectOrientedProgramming,OOP,面向?qū)ο蟪绦蛟O(shè)計)是一種計算機編程架構(gòu)。OOP的一條基本原則是計算機程序是由單個能夠起到子程序作用的單元或?qū)ο蠼M合而成。OOP達到了軟件工程的三個主要目標:重用性、靈活性和擴展性。面向?qū)ο髷?shù)據(jù)庫吸收了面向?qū)ο蟪绦蛟O(shè)計方法的核心概念和基本思想,采用面向?qū)ο蟮挠^點來描述現(xiàn)實世界實體(對象)的邏輯組織、對象之間的限制和聯(lián)系等

。1.2數(shù)據(jù)庫系統(tǒng)1.2.1數(shù)據(jù)庫系統(tǒng)的相關(guān)概念1、數(shù)據(jù)庫(DataBase,DB)是存儲在計算機存儲設(shè)備中的、結(jié)構(gòu)化的、可共享的數(shù)據(jù)集合。是關(guān)于某個特定主題或目的數(shù)據(jù)的集合,或者理解為用來存儲和管理所需各種信息的通用“倉庫”。2、數(shù)據(jù)庫管理系統(tǒng)(DBMS)是為數(shù)據(jù)庫的建立、使用和維護而配置的軟件。它是數(shù)據(jù)庫系統(tǒng)的核心組成部分。3、數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng)(DataBaseSystem,DBS)是引入數(shù)據(jù)庫技術(shù)后的計算機系統(tǒng),包括:硬件系統(tǒng)、數(shù)據(jù)庫集合、數(shù)據(jù)庫管理系統(tǒng)及相關(guān)軟件、數(shù)據(jù)庫管理員、用戶。4、數(shù)據(jù)庫應(yīng)用系統(tǒng)數(shù)據(jù)庫應(yīng)用系統(tǒng)是用數(shù)據(jù)庫系統(tǒng)開發(fā)的面向某類實際應(yīng)用的計算機應(yīng)用軟件。如:學生管理系統(tǒng)、圖書管理系統(tǒng)。5、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)三者的關(guān)系數(shù)據(jù)庫系統(tǒng)包括數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)。1.2.2數(shù)據(jù)庫系統(tǒng)特點(1)數(shù)據(jù)的結(jié)構(gòu)化(2)數(shù)據(jù)的共享性好(3)數(shù)據(jù)的獨立性好(4)數(shù)據(jù)的冗余量?。?)數(shù)據(jù)由DBMS統(tǒng)一管理和平控制1.2.3數(shù)據(jù)庫系統(tǒng)的三級模式體系結(jié)構(gòu)數(shù)據(jù)庫系統(tǒng)在總體結(jié)構(gòu)上一般都體現(xiàn)為三級模式的結(jié)構(gòu)特征,即外模式、模式和內(nèi)模式,分別反映了看待數(shù)據(jù)庫的3個角度。模式(Schema):又稱概念模式或邏輯模式,是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述。2、外模式(ExternalSchema):也稱子模式或用戶模式,是數(shù)據(jù)庫用戶看見和使用的局部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述。3、內(nèi)模式(InternalSchema)又叫做存儲模式,是數(shù)據(jù)在數(shù)據(jù)庫系統(tǒng)中的內(nèi)部表示,即數(shù)據(jù)的物理結(jié)構(gòu)和存儲方式的描述。例:如果把一個話劇團看作一個數(shù)據(jù)庫系統(tǒng),那么,所有演員的集合就是它的模式,它不同于其他話劇團;觀眾看到的某一場話劇的演員為外模式,它只是全體演員即模式的子集;演員的住宿方式就是內(nèi)模式了,它表述了演員的物理存在形式1.2.3數(shù)據(jù)庫系統(tǒng)的兩級映射和數(shù)據(jù)的獨立性數(shù)據(jù)庫系統(tǒng)在三級模式中提供了兩次映像:外模式到模式的映像和模式到內(nèi)模式的映像,而這兩次映像就實現(xiàn)了數(shù)據(jù)庫中數(shù)據(jù)兩個層次的獨立性,即物理獨立性和邏輯獨立性。數(shù)據(jù)庫數(shù)據(jù)庫模式外模式1內(nèi)模式外模式2外模式3應(yīng)用1應(yīng)用2應(yīng)用3應(yīng)用4應(yīng)用51.3數(shù)據(jù)模型數(shù)據(jù)模型是用來抽象、表示和處理現(xiàn)實世界的數(shù)據(jù)和信息的工具,也就是現(xiàn)實世界數(shù)據(jù)特征的抽象。1.3.1實體描述1、概念模型的相關(guān)概念(1)實體(Entity):客觀存在并相互區(qū)別的事物及其事物之間的聯(lián)系。例如,一個學生、一門課程、學生的一次選課、一次考試等都是實體。(2)屬性(Attribute):實體所具有的某一特性。例如,學生的學號、姓名、性別、出生年份、系、入學時間等。(3)碼(Key):唯一標示實體的屬性集。例如,學號是學生實體的碼。(4)域(Domain):屬性的取值范圍。例如,年齡的域為15至35之間。(5)實體型(EntityType):用實體名及其屬性名集合來抽象和刻畫同類實體,稱為實體型。例如,學生(學號,姓名,性別,出生年份,系,入學時間)就是一個實體型。(6)實體集(EntitySet):同型實體的集合稱為實體集。如,全體學生就是一個實體集。(7)聯(lián)系(Relationship):實體與實體之間以及實體與組成它的各屬性間的關(guān)系。2、實體間聯(lián)系的三種情況(1)一對一聯(lián)系(1:1)如果對于實體集A中的每一個實體,實體集B中至少有一個(也可以沒有)實體與之聯(lián)系,反之亦然,則稱實體集A與實體集B具有一對一聯(lián)系,記為1:1。例如,一個學生只能有一個學號,而一個學號只能指向一個學生,則學生與學號之間具有一對一聯(lián)系。(2)一對多聯(lián)系(1:n)如果對于實體集A中的每一個實體,實體集B中有個n實體(n≥0)之聯(lián)系,反之,對于實體集B中的每一個實體,實體集A中至多只有一個實體與之聯(lián)系,則稱實體集A與實體集B有一對多聯(lián)系,記為1:n。例如,一個班級中有若干名學生,而每個學生只在一個班級中學習,則班級與學生之間具有一對多聯(lián)系。(3)多對多聯(lián)系(m:n)如果對于實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯(lián)系,反之,對于實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之聯(lián)系,則稱實體集A與實體集B具有多對多聯(lián)系,記為m:n。例如,一門課程同時有若干個學生選修,而一個學生可以同時選修多門課程,則課程與學生之間具有多對多聯(lián)系。注意:實際上,一對一聯(lián)系是一對多聯(lián)系的特例,而一對多聯(lián)系又是多對多聯(lián)系的特例。3、概念模型的表示方法概念模型的表示方法很多,最常用的是實體—聯(lián)系方法。該方法用E-R(Entity—RelationshipApproch)圖來描述現(xiàn)實世界的概念模型。E-R圖提供了表示實體型、屬性和聯(lián)系的方法。E-R圖有三個要素:(1)實體型:用矩形表示,矩形框內(nèi)寫明實體名。(2)屬性:用橢圓形表示,并用無向邊將其與相應(yīng)的實體連接起來。(3)聯(lián)系:用菱形表示,菱形框內(nèi)寫明聯(lián)系名,并用無向邊分別與有關(guān)實體連接起來,同時在無向邊旁標上聯(lián)系的類型(1:1,1:n或m:n)。1.3.2數(shù)據(jù)模型的基本組成1、數(shù)據(jù)結(jié)構(gòu)2、數(shù)據(jù)操作3、數(shù)據(jù)的約束條件1.3.3數(shù)據(jù)模型的分類數(shù)據(jù)模型有3種:層次模型、網(wǎng)狀模型、關(guān)系模型。1.層次模型層次模型是樹型結(jié)構(gòu),自頂向下,層次分明。層次模型要滿足以下兩個條件:?有且只有一個根節(jié)點,根節(jié)點沒有雙親。?其他節(jié)點有且只有一個雙親2,網(wǎng)狀模型網(wǎng)狀模型是用無向圖結(jié)構(gòu),是一種交叉關(guān)系,是關(guān)系模型的擴展。網(wǎng)狀模型要滿足以下兩個條件:?允許一個以上的節(jié)點沒有雙親。?一個節(jié)點有多于一個的雙親。3,關(guān)系模型關(guān)系模型是用二維表結(jié)構(gòu),在關(guān)系模型中,操作對象和操作結(jié)果都是二維表。關(guān)系模型是目前最重要的數(shù)據(jù)模型,被幾乎所有數(shù)據(jù)庫管理系統(tǒng)支持。關(guān)系模型要滿足以下幾個性質(zhì):?元組個數(shù)有限性:元組的個數(shù)據(jù)是有限的。?元組惟一性:每個元組都是惟一的。?元組次序無關(guān)性:元組的次序可以任意交換。?元組分量的原子性:元組的分量是不可分割的基本數(shù)據(jù)項。?屬性名惟一性:屬性的名稱各不相同。?屬性次序無關(guān)性:屬性的次序可以任意交換。?屬性分量值域同一性:屬性的分量與與屬性值域相同。1.4關(guān)系數(shù)據(jù)庫1.4.1關(guān)系基本概念(1)關(guān)系:一個關(guān)系就是一張二維表,每個關(guān)系都有一個關(guān)系名,即數(shù)據(jù)表名。(2)元組:表中的行稱為元組,一行就是一個元組,對應(yīng)表中一條記錄。(3)屬性:表中的列稱為屬性,即字段。字段名稱為屬性名,字段值稱為屬性值。(4)域:屬性的取值范圍,如,分數(shù)在0~100之間。(5)關(guān)鍵字:表中的一個屬性(組),它的值可以唯一地標志一個元組。如:學號。(6)候選碼:表中的某一個屬性,它的值可以唯一地標志一個元組。一個表中可能有多個候選碼,選擇一個作為主鍵,主鍵的屬性稱為主屬性。(7)外關(guān)鍵字:如果一個關(guān)系中的屬性或?qū)傩越M并非該關(guān)系的關(guān)鍵字,但它們是另外一個關(guān)系的關(guān)鍵字,則稱其為該關(guān)系的外關(guān)鍵字。1.4.2關(guān)系的特點1.4.3關(guān)系數(shù)據(jù)庫的概念1.4.3關(guān)系的完整性關(guān)系模型對數(shù)據(jù)一般都具有一定的限制,這種限制稱為完整性或完整性約束。關(guān)系模型的完整性是保證關(guān)系數(shù)據(jù)表正確的關(guān)鍵。關(guān)系模型支持實體完整性約束、參照完整性約束和域約束3種完整性約束。(1)實體完整性約束假設(shè)A是一個表R的主鍵,則A不能接收空值,即單列主鍵的值不能為空,復(fù)合主鍵的任何列也不能接收空值。例如,在學生信息表中,“學號”為該表的主鍵,那么在數(shù)據(jù)庫的任何記錄中,“學號”列的值都不能為空。這樣的約束稱為實體完整性約束。(2)參照完整性約束參照完整性約束關(guān)心的是邏輯相關(guān)的表中值與值之間的關(guān)系。假設(shè)X是一個表A的主鍵,在表B中是外鍵,那么若K是表B中一個外部鍵值,則表A中必然存在在X上的值為K的記錄。例如,“系編碼”是院系信息表的主鍵,而在學生信息表中是相對于院系信息表的外鍵(學生信息表中的主關(guān)鍵字是由“學號”和“系編碼”組合而成),對于學生信息表的任何記錄,其所包含的“系編碼”的值,在院系信息表的“系編碼”列中必然存在一個相同的值。這樣的約束稱為參照完整性約束。1.4.5關(guān)系運算關(guān)系的基本運算有兩類:傳統(tǒng)的集合運算和專門的關(guān)系運算。1、傳統(tǒng)的集合運算(1)并(Union):設(shè)有兩個關(guān)系R和S,它們具有相同的結(jié)構(gòu)。R和S的并是由屬于R或?qū)儆赟的元組組成的集合,運算符為∪。例如:設(shè)每個班有一個學生關(guān)系R1,R2,R3,…則全校學生關(guān)系T是:

T=R1∪R2∪R3∪…(2)差(Difference):設(shè)有兩個關(guān)系R和S,它們具有相同的結(jié)構(gòu)。R和S的差是由屬于R但不屬于S的元組組成的集合。運算符為-。例如:設(shè)有參加計算機小組的學生關(guān)系R,參加橋牌小組的學生關(guān)系S。求參加了計算機

小組但沒有參加橋牌小組的學生。結(jié)果放在關(guān)系T1中,則T1=R-S。(3)交(Intersection):設(shè)有兩個關(guān)系R和S,它們具有相同的結(jié)構(gòu)。R和S的交是由既屬于R又屬于S的元組組成的集合,運算符為∩。交運算的結(jié)果是R和S的共同元組。例如:設(shè)有參加計算機小組的學生關(guān)系R,參加橋牌小組的學生關(guān)系S。求既參加了計算機小組又參加橋牌小組的學生。結(jié)果放在關(guān)系T2中,則T2=R∩S。關(guān)系的交可以用關(guān)系的差來表示。即R∩S=R-(R–S),所以,上式也可以寫成:T2=R-(R–S)。2、專門的關(guān)系運算(1)選擇(Selection):按照給定條件從指定的關(guān)系中挑選出滿足條件的元組構(gòu)成新的關(guān)系,其關(guān)系模式不變,但其中元組的數(shù)目小于等于原來的關(guān)系中元組的個數(shù),它是原關(guān)系的一個子集。這是從行的角度進行的運算,即水平方向抽取元組。(2)投影(projection):從指定的關(guān)系中挑選出某些屬性構(gòu)成新的關(guān)系,其關(guān)系模式所包含的屬性個數(shù)往往比原關(guān)系少,或者屬性的排列順序不同。投影的結(jié)果將取消由于取消了某些列而產(chǎn)生的重復(fù)元組。例如:設(shè)有讀者關(guān)系,讀者(借書證號,姓名,性別,單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論