第1章 數(shù)據(jù)庫概論_第1頁
第1章 數(shù)據(jù)庫概論_第2頁
第1章 數(shù)據(jù)庫概論_第3頁
第1章 數(shù)據(jù)庫概論_第4頁
第1章 數(shù)據(jù)庫概論_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)庫原理與系統(tǒng)課程簡介

1、課程研究對象和研究內(nèi)容(1)

數(shù)據(jù)庫技術(shù)是計算機科學(xué)領(lǐng)域中應(yīng)用最廣也是發(fā)展最快的技術(shù)之一,它已成為計算機信息系統(tǒng)與應(yīng)用系統(tǒng)的核心技術(shù)和重要基礎(chǔ)?!稊?shù)據(jù)庫原理與系統(tǒng)》是計算機有關(guān)專業(yè)(指本科生)的必修課程。1、課程研究對象和研究內(nèi)容(2)本課程的任務(wù)是使學(xué)生在正確理解數(shù)據(jù)庫原理的基礎(chǔ)上,熟練掌握數(shù)據(jù)庫的基本概念和基本理論,熟悉主流數(shù)據(jù)庫管理系統(tǒng)(SQLServer2012)的應(yīng)用技術(shù),同時具備一定的數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計、開發(fā)能力。

2、本課程在整個課程體系中的地位

“數(shù)據(jù)庫原理與系統(tǒng)”是計算機有關(guān)專業(yè)學(xué)生的必修課,也是學(xué)習(xí)物理、數(shù)學(xué)、電子、電子商務(wù)等專業(yè)主修課程。學(xué)習(xí)這門課程的先行課程是

《C語言》或《VFP數(shù)據(jù)庫程序設(shè)計》及《數(shù)據(jù)結(jié)構(gòu)》

,后續(xù)課程是《大型數(shù)據(jù)庫系統(tǒng)》和《軟件工程》。

數(shù)據(jù)庫原理與系統(tǒng)的重要性

數(shù)據(jù)庫技術(shù)產(chǎn)生于六十年代末,是數(shù)據(jù)管理的最新技術(shù),是計算機科學(xué)的重要分支。

數(shù)據(jù)庫技術(shù)是信息系統(tǒng)的核心和基礎(chǔ),它的出現(xiàn)極大地促進(jìn)了計算機應(yīng)用向各行各業(yè)的滲透。

數(shù)據(jù)庫的建設(shè)規(guī)模、數(shù)據(jù)庫信息量的大小和使用頻度已成為衡量一個國家信息化程度的重要標(biāo)志。可以說,只要有計算機的地方,就在使用著數(shù)據(jù)庫技術(shù)。因此,數(shù)據(jù)庫技術(shù)的基本知識和基本技能正在成為信息社會人們的必備知識。

本章目錄

1.1

數(shù)據(jù)管理技術(shù)的發(fā)展階段與數(shù)據(jù)庫技

術(shù)概念1.2

數(shù)據(jù)庫技術(shù)的新發(fā)展1.3本章小結(jié)習(xí)題1.1

數(shù)據(jù)管理技術(shù)的發(fā)展階段與數(shù)據(jù)庫技術(shù)概念隨著數(shù)據(jù)處理實際應(yīng)用的需要,引發(fā)了數(shù)據(jù)庫技術(shù)不斷發(fā)展,數(shù)據(jù)處理需要存儲大量數(shù)據(jù),在計算機中,存儲數(shù)據(jù)的硬件是存儲器。在20世紀(jì)50年代末,存儲器容量只能存儲5-10MB的的信息容量,到60年代末才達(dá)到近100MB的容量,初步具有了存放大量數(shù)據(jù)信息的條件,數(shù)據(jù)管理技術(shù)這時候才真正開始發(fā)展,所以說,數(shù)據(jù)管理技術(shù)的發(fā)展是與計算機中外部存儲器的發(fā)展密切有關(guān)。從70年代開始,存儲器的存儲容量得到飛速發(fā)展,到現(xiàn)在為止,幾百GB的硬盤隨處都可以買到,數(shù)據(jù)庫中存儲數(shù)據(jù)的困難完全解決,數(shù)據(jù)管理新技術(shù)也不斷出現(xiàn)。下面介紹數(shù)據(jù)管理技術(shù)的三個發(fā)展階段和目前使用的數(shù)據(jù)庫技術(shù)的基本概念

1.1數(shù)據(jù)庫系統(tǒng)概述

1.1.1

數(shù)據(jù)管理技術(shù)的三個發(fā)展階段1.1.2數(shù)據(jù)庫系統(tǒng)階段產(chǎn)生的3大新技術(shù)1.1.3數(shù)據(jù)庫系統(tǒng)的主要特點1.1.4數(shù)據(jù)庫技術(shù)中的幾個主要名稱

數(shù)據(jù)管理技術(shù)的產(chǎn)生和發(fā)展

從20世紀(jì)50年代開始至70年代初,數(shù)據(jù)管理技術(shù)的發(fā)展經(jīng)歷了人工管理、文件管理和數(shù)據(jù)庫管理三個階段。人工管理階段文件系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段結(jié)論

人工管理階段(1)

20世紀(jì)50年代中期以前,計算機主要用于科學(xué)計算。硬件設(shè)施方面:外存只有紙帶、卡片、磁帶,沒有磁盤等直接存取設(shè)備;軟件方面:沒有操作系統(tǒng)和管理數(shù)據(jù)的軟件;數(shù)據(jù)處理方式是批處理。人工管理數(shù)據(jù)具有以下幾個特點:(1)數(shù)據(jù)不能長期保存在計算機內(nèi)。人工管理階段(2)(2)數(shù)據(jù)不共享。數(shù)據(jù)是面向應(yīng)用的,一組數(shù)據(jù)只能對應(yīng)一個程序。如果多個應(yīng)用程序涉及某些相同的數(shù)據(jù),則由于必須各自進(jìn)行定義,無法進(jìn)行數(shù)據(jù)的共享,因此程序間有大量的冗余數(shù)據(jù)。(3)數(shù)據(jù)不具有獨立性。數(shù)據(jù)的獨立性包括了數(shù)據(jù)的邏輯獨立性和數(shù)據(jù)的物理獨立性。當(dāng)數(shù)據(jù)的邏輯結(jié)構(gòu)或物理結(jié)構(gòu)發(fā)生變化時,必須對應(yīng)用程序做相應(yīng)的修改。在人工管理階段,程序與數(shù)據(jù)之間的對應(yīng)關(guān)系可用下圖表示。人工管理階段應(yīng)用程序與數(shù)據(jù)之間的對應(yīng)關(guān)系

文件系統(tǒng)階段(1)

20世紀(jì)50年代后期到60年代中期,這時計算機已大量用于數(shù)據(jù)的管理。硬件方面:有了磁盤、磁鼓等直接存取存儲設(shè)備;軟件方面:操作系統(tǒng)中已經(jīng)有了專門的管理軟件,一般稱為文件系統(tǒng);處理方式有批處理、聯(lián)機實時處理等。特點如下:(1)數(shù)據(jù)以“文件”形式可以長期保存在外部存儲器的磁盤上。(2)數(shù)據(jù)的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)有了區(qū)別,但比較簡單。文件系統(tǒng)階段(2)(3)文件組織已有多樣化。有索引文件、鏈接文件和直接存取文件。(4)數(shù)據(jù)不再屬于某個特定的程序,可以重復(fù)使用,即數(shù)據(jù)面向應(yīng)用。(5)對數(shù)據(jù)的操作以記錄為單位。由于文件系統(tǒng)階段中設(shè)計的文件相互獨立,本質(zhì)上存在許多缺陷,主要是數(shù)據(jù)冗余大、各文件中數(shù)據(jù)的不一致性不可避免、數(shù)據(jù)之間聯(lián)系弱。在文件系統(tǒng)階段,程序與數(shù)據(jù)之間的對應(yīng)關(guān)系可用下圖表示。

文件系統(tǒng)階段應(yīng)用程序與數(shù)據(jù)之間的對應(yīng)關(guān)系倒排文件系統(tǒng)階段(1)產(chǎn)生背景:在20世紀(jì)60年代中期,數(shù)據(jù)管理規(guī)模一再擴大,數(shù)據(jù)量急劇增加,為了提高系統(tǒng)處理數(shù)據(jù)能力,人們開始對文件系統(tǒng)加以擴充,研制成倒排文件系統(tǒng)(InvertedFile)。(2)特點:倒排文件是索引文件的推廣,對每個字段都提供單獨的索引。這些文件很適合于信息檢索系統(tǒng)。(3)缺點:要占用許多內(nèi)存,而當(dāng)時內(nèi)存昂貴。倒排文件系統(tǒng)階段應(yīng)歸屬于文件系統(tǒng)階段.數(shù)據(jù)庫系統(tǒng)階段20世紀(jì)60年代后期以來,計算機用于管理的規(guī)模更為龐大,數(shù)據(jù)量急劇增長,硬件已有大容量磁盤,硬件價格下降;軟件價格則上升,使得編制、維護(hù)軟件及應(yīng)用程序成本相對增加;處理方式上,聯(lián)機實時處理要求更多,分布處理也在考慮之中。介于這種情況,文件系統(tǒng)的數(shù)據(jù)管理滿足不了應(yīng)用的需求,為解決共享數(shù)據(jù)的需求,隨之從文件系統(tǒng)中分離出了專門軟件系統(tǒng)——數(shù)據(jù)庫管理系統(tǒng),用來統(tǒng)一管理數(shù)據(jù)。數(shù)據(jù)庫系統(tǒng)階段應(yīng)用程序與數(shù)據(jù)之間的對應(yīng)關(guān)系可用下圖表示。數(shù)據(jù)庫系統(tǒng)階段應(yīng)用程序與數(shù)據(jù)之間的對應(yīng)關(guān)系結(jié)

論綜上所述,如上圖所示,隨著數(shù)據(jù)管理技術(shù)的不斷發(fā)展,應(yīng)用程序不斷從底層的、低級的、物理的數(shù)據(jù)管理工作中解脫出來,能獨立的、較高邏輯級別地輕松處理數(shù)據(jù)庫數(shù)據(jù)。從而能極大地提高了應(yīng)用軟件的生產(chǎn)力。1.1.2數(shù)據(jù)庫發(fā)展中出現(xiàn)的三大新技術(shù)1、層次數(shù)據(jù)庫的發(fā)明1968年IBM公司研制IMS(InformationManagementSystem)信息管理系統(tǒng)是典型的層次數(shù)據(jù)庫系統(tǒng)。2、網(wǎng)狀數(shù)據(jù)庫的發(fā)明1969年美國數(shù)據(jù)系統(tǒng)語言協(xié)會的數(shù)據(jù)庫研究小組DBTG(DateBaseTaskGroup)提出了網(wǎng)狀數(shù)據(jù)庫系統(tǒng)的報告。3、關(guān)系數(shù)據(jù)庫的發(fā)明1970年,E.F.Codd首先在美國計算機學(xué)會通信雜志發(fā)表關(guān)系型數(shù)據(jù)庫方面的論文。

1.1.3數(shù)據(jù)庫系統(tǒng)的特點

主要特點:數(shù)據(jù)結(jié)構(gòu)化有較高的數(shù)據(jù)獨立性

數(shù)據(jù)庫系統(tǒng)為用戶提供了方便的用戶接口數(shù)據(jù)庫系統(tǒng)提供四方面的數(shù)據(jù)控制功能結(jié)論數(shù)據(jù)結(jié)構(gòu)化

數(shù)據(jù)庫系統(tǒng)采用數(shù)據(jù)模型表示復(fù)雜的數(shù)據(jù)結(jié)構(gòu),這是數(shù)據(jù)庫與文件系統(tǒng)的根本區(qū)別。在文件系統(tǒng)中,相互獨立的文件記錄內(nèi)部是有結(jié)構(gòu)的,最簡單的形式是等長記錄,這種結(jié)構(gòu)是面向某一具體應(yīng)用的,缺乏靈活性;而數(shù)據(jù)庫系統(tǒng)實現(xiàn)了整體的結(jié)構(gòu)化,數(shù)據(jù)不再面向某一應(yīng)用,而是面向全組織,不僅數(shù)據(jù)具有結(jié)構(gòu),而且存取數(shù)據(jù)的方式非常靈活,可以存取數(shù)據(jù)庫中的某一個數(shù)據(jù)項、一組數(shù)據(jù)項、一個記錄或一組記錄,而在文件系統(tǒng)中,數(shù)據(jù)的最小存取單位是記錄,粒度不能細(xì)到數(shù)據(jù)項。

數(shù)據(jù)的獨立性包括數(shù)據(jù)的物理獨立性和邏輯獨立性。前者是指用戶的應(yīng)用程序與存儲在磁盤上的數(shù)據(jù)庫中數(shù)據(jù)是相互獨立的,當(dāng)數(shù)據(jù)的物理存儲改變了,應(yīng)用程序不用改變;后者是指用戶的應(yīng)用程序與數(shù)據(jù)庫的邏輯結(jié)構(gòu)是相互獨立的,數(shù)據(jù)的邏輯結(jié)構(gòu)改變了,用戶程序也可以不變。這一點在后面數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)中會作比較詳細(xì)的說明。有較高的數(shù)據(jù)獨立性

用戶可以使用查詢語言或終端命令操作數(shù)據(jù)庫,也可以用程序方式(例如使用各種高級語言:C++、C#、VisualBasic等編寫的程序調(diào)用)操作數(shù)據(jù)庫,解決了數(shù)據(jù)共享的問題,而且降低了數(shù)據(jù)的冗余度并易于擴充。 數(shù)據(jù)庫系統(tǒng)為用戶提供了

方便的用戶接口數(shù)據(jù)庫系統(tǒng)提供四方面的數(shù)據(jù)控制功能(1)數(shù)據(jù)庫的并發(fā)控制(Concurrency)。對多用戶同時需要應(yīng)用數(shù)據(jù)庫的并發(fā)操作加以控制和協(xié)調(diào),防止相互干擾而得到錯誤的結(jié)果。(2)數(shù)據(jù)庫恢復(fù)(Recovery)。在某一特殊情況下,數(shù)據(jù)庫被破壞或數(shù)據(jù)不可靠時,系統(tǒng)有能力將數(shù)據(jù)庫從錯誤狀態(tài)恢復(fù)到某一已知的正確狀態(tài)。(3)數(shù)據(jù)庫的完整性(Integrity)。在數(shù)據(jù)庫運行過程中,系統(tǒng)能將數(shù)據(jù)控制在有效的范圍內(nèi),或保證數(shù)據(jù)之間能滿足一定的關(guān)系。數(shù)據(jù)庫系統(tǒng)提供四方面的數(shù)據(jù)控制功能(4)數(shù)據(jù)的安全性(Security)。保護(hù)數(shù)據(jù),防止不合法用戶的使用造成數(shù)據(jù)的泄密和破壞,使每個用戶只能按指定方式操縱數(shù)據(jù)。總的來說,數(shù)據(jù)庫系統(tǒng)增加了系統(tǒng)的靈活性。對數(shù)據(jù)的操作可以是集合形式操作,也可以以記錄為單位操作,還可以以單個字段或多個字段為單位操作。

結(jié)論目前,數(shù)據(jù)庫已經(jīng)成為現(xiàn)代信息系統(tǒng)的不可分離的重要組成部分。

數(shù)據(jù)庫系統(tǒng)的出現(xiàn)使信息系統(tǒng)從以加工數(shù)據(jù)的程序為中心轉(zhuǎn)向圍繞共享的數(shù)據(jù)庫為中心的新階段。這樣既便于數(shù)據(jù)的集中管理,又有利于應(yīng)用程序的研制和維護(hù),提高了數(shù)據(jù)的利用率和相容性,提高了決策的可靠性。數(shù)據(jù)庫技術(shù)是計算機領(lǐng)域中發(fā)展最快的技術(shù)之一,數(shù)據(jù)庫技術(shù)的發(fā)展是沿著數(shù)據(jù)模型的主線展開的。數(shù)據(jù)庫新技術(shù)中的幾個主要名稱數(shù)據(jù)數(shù)據(jù)庫數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)(Data)(1)定義數(shù)據(jù)是用來記錄信息的可識別的符號,是信息的具體表現(xiàn)形式。(2)表現(xiàn)形式數(shù)據(jù)是數(shù)據(jù)庫中存儲的基本對象。按廣義的理解來說,數(shù)據(jù)的種類有很多,如文字、圖像、聲音、等等都可以轉(zhuǎn)化為計算機可以識別的標(biāo)識,可以以數(shù)字化后的二進(jìn)制形式存入計算機。在日常生活中人們可以對事務(wù)直接用自然語言描述。在計算機中存儲和處理時,就要抽出對這些事物感興趣的特征組成一個記錄來描述。(3)與信息的聯(lián)系數(shù)據(jù)解釋的含義稱為數(shù)據(jù)的語義(即信息),數(shù)據(jù)與其語義是不可分的。可以這樣認(rèn)為:數(shù)據(jù)是信息的符號表示或載體,信息則是數(shù)據(jù)的內(nèi)涵,是對數(shù)據(jù)的語義解釋。數(shù)據(jù)庫(DataBase,簡稱DB)(1)數(shù)據(jù)庫從字面意思來說就是存放數(shù)據(jù)的倉庫。具體而言就是長期存放在計算機內(nèi)的有組織的可共享的數(shù)據(jù)集合,可供多用戶共享,數(shù)據(jù)庫中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和儲存,具有盡可能小的冗余度和較高的數(shù)據(jù)獨立性和易擴張性。(2)數(shù)據(jù)庫具有兩個比較突出的特點①把在特定的環(huán)境中與某應(yīng)用程序相關(guān)的數(shù)據(jù)及其聯(lián)系集中在一塊并按照一定的結(jié)構(gòu)形式進(jìn)行存儲,即集成性。②數(shù)據(jù)庫中的數(shù)據(jù)能被多個應(yīng)用程序的用戶所使用,即共享性。數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,簡稱DBMS)(1)數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫的核心組成部分,是對數(shù)據(jù)庫中數(shù)據(jù)進(jìn)行管理的大型系統(tǒng)軟件,是位于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,它為用戶或應(yīng)用程序提供了訪問數(shù)據(jù)庫的方法,包括數(shù)據(jù)庫的建立、查詢、更新及各種數(shù)據(jù)控制。具體來說包括以下4個主要功能:(1)數(shù)據(jù)定義。DBMS提供數(shù)據(jù)定義語言(DataDefinitionLanguage,簡稱DDL),用戶通過它可以方便地對數(shù)據(jù)庫中的數(shù)據(jù)對象(包括表、視圖、索引、存儲過程等)進(jìn)行定義。定義相關(guān)的數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)和有關(guān)的約束條件。

數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,簡稱DBMS)(2)(3)數(shù)據(jù)庫的運行管理。這一功能是數(shù)據(jù)庫管理系統(tǒng)的核心所在。DBMS通過數(shù)據(jù)庫在建立、運用和維護(hù)時統(tǒng)一管理和控制,以保證數(shù)據(jù)安全、正確、有效的正常運行。DBMS主要通過數(shù)據(jù)的安全性控制、完整性控制、多用戶應(yīng)用環(huán)境的并發(fā)性控制和數(shù)據(jù)庫數(shù)據(jù)的系統(tǒng)備份與恢復(fù)四個方面來實現(xiàn)對數(shù)據(jù)庫的統(tǒng)一控制功能的(這一內(nèi)容會在第7章中詳細(xì)介紹)。(4)數(shù)據(jù)庫的建立和維護(hù)功能。數(shù)據(jù)庫的建立和維護(hù)功能包括數(shù)據(jù)庫初始數(shù)據(jù)的輸入、轉(zhuǎn)換功能、數(shù)據(jù)庫的轉(zhuǎn)儲、恢復(fù)功能、重組織功能、性能監(jiān)視和分析功能等。這些功能均可以使用DBMS中的一些專用命令來解決。數(shù)據(jù)庫系統(tǒng)(DataBaseSystem,簡稱DBS)

數(shù)據(jù)庫系統(tǒng)是實現(xiàn)有組織地、動態(tài)地存儲大量關(guān)聯(lián)數(shù)據(jù)、方便多個用戶訪問的硬件、軟件和數(shù)據(jù)資源組成的系統(tǒng),即采用數(shù)據(jù)庫技術(shù)的計算機系統(tǒng)。它主要有以下4部分組成:(1)數(shù)據(jù)庫(DB)(2)硬件(3)軟件。這一部分包括DBMS、操作系統(tǒng)(OS)、各種開發(fā)數(shù)據(jù)庫的高級語言和各種應(yīng)用開發(fā)支撐軟件程序。(4)用戶:包括數(shù)據(jù)庫管理員(DatabaseAdministrator,DBA),系統(tǒng)分析員和數(shù)據(jù)庫設(shè)計人員,應(yīng)用程序員,一般用戶幾種.數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)圖1.2數(shù)據(jù)庫技術(shù)的新發(fā)展雖然目前的數(shù)據(jù)庫技術(shù)已經(jīng)比較完美,但隨著社會信息量持續(xù)增加,信息處理技術(shù)不斷發(fā)展,數(shù)據(jù)庫技術(shù)也在不斷發(fā)展。每個學(xué)員都要及時跟蹤和學(xué)習(xí)數(shù)據(jù)庫技術(shù)的最新進(jìn)展,以便能掌握它的最新技術(shù)為自己的工作服務(wù)。本節(jié)主要簡單介紹數(shù)據(jù)庫研究領(lǐng)域和數(shù)據(jù)庫發(fā)展兩方面的知識。數(shù)據(jù)庫技術(shù)的新發(fā)展目錄1.2.1數(shù)據(jù)庫技術(shù)研究的主要領(lǐng)域1.2.2數(shù)據(jù)庫技術(shù)的新發(fā)展數(shù)據(jù)庫技術(shù)研究的主要領(lǐng)域數(shù)據(jù)庫技術(shù)研究領(lǐng)域研究的問題十分廣泛,也十分復(fù)雜,綜合起來,可以歸結(jié)為以下3個方面:(1)數(shù)據(jù)庫理論研究領(lǐng)域(2)數(shù)據(jù)庫系統(tǒng)軟件的研制(3)數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計與開發(fā)數(shù)據(jù)庫技術(shù)的新發(fā)展

從20世紀(jì)70年代末發(fā)明了數(shù)據(jù)庫系統(tǒng)后,至今數(shù)據(jù)庫技術(shù)已經(jīng)歷了3個發(fā)展階段,第1階段是格式化數(shù)據(jù)模型包括層次模型和網(wǎng)狀模型;第2階段是關(guān)系數(shù)據(jù)庫模型;第3階段是面向?qū)ο蟮臄?shù)據(jù)模型。雖然第三階段的技術(shù)還不很成熟,但已經(jīng)可以看出它的優(yōu)越性。數(shù)據(jù)庫技術(shù)發(fā)展方向很多,下面介紹的是目前發(fā)展比較突出、應(yīng)用比較廣泛的面向?qū)ο髷?shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘3個方面的知識。面向?qū)ο髷?shù)據(jù)庫

面向?qū)ο髷?shù)據(jù)庫(ObjectOrientedDataBase,簡稱OODB)就是把面向?qū)ο蟮姆椒ê蛿?shù)據(jù)庫技術(shù)結(jié)合起來的一種數(shù)據(jù)庫。這種數(shù)據(jù)庫可以使數(shù)據(jù)庫系統(tǒng)的分析、設(shè)計最大程度地與人們對客觀世界的認(rèn)識相一致。面向?qū)ο髷?shù)據(jù)庫系統(tǒng)(ObjectOrientedDataBaseSystem,簡稱OODBS)是為了滿足新的數(shù)據(jù)庫應(yīng)用需要而產(chǎn)生的新一代數(shù)據(jù)庫系統(tǒng)。面向?qū)ο髷?shù)據(jù)庫的概念有5個核心概念:①對象是基本的數(shù)據(jù)結(jié)構(gòu),對象是存儲和操作的基本單位。②每個對象有一個永久的標(biāo)識符,這個標(biāo)識符在該對象的整個生命周期中都有效,即不論該對象是存儲在外存或內(nèi)存中都有效。③對象可以被指定為類型和子類型,子類型可以繼承父類型的所有數(shù)據(jù)特征和行為。④對象狀態(tài)由數(shù)據(jù)值與聯(lián)系定義。⑤對象行為由對象操作定義需要面向?qū)ο髷?shù)據(jù)庫應(yīng)用的領(lǐng)域①輔助軟件工程(CASE)、計算機輔助印刷(CAP)和材料需求計劃(MRP)領(lǐng)域。②目前應(yīng)用較為廣泛的多媒體數(shù)據(jù)庫。③人工智能(AI)應(yīng)用的需要。④商業(yè)應(yīng)用領(lǐng)域。目前面向?qū)ο蟮臄?shù)據(jù)庫有許多產(chǎn)品出現(xiàn),應(yīng)該說,比較好的產(chǎn)品是數(shù)據(jù)庫Oracle

8。它的基礎(chǔ)是關(guān)系數(shù)據(jù)庫,但它又引入了面向?qū)ο蟮募夹g(shù)。

數(shù)據(jù)倉庫

數(shù)據(jù)倉庫,英文名稱為DataWarehouse,可簡寫為DW數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。數(shù)據(jù)倉庫的特征(1)①面向主題:操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織的。②集成性:數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息。數(shù)據(jù)倉庫的特征(2)③相對穩(wěn)定性:數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。④時變性:所謂時變性就是能反映歷史的變化。數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點(如開始應(yīng)用數(shù)據(jù)倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。數(shù)據(jù)倉庫系統(tǒng)的基本組成從功能結(jié)構(gòu)化來分,數(shù)據(jù)倉庫系統(tǒng)至少應(yīng)該包含數(shù)據(jù)獲?。―ataAcquisition)、數(shù)據(jù)存儲(DataStorage)、數(shù)據(jù)訪問(DataAccess)三個關(guān)鍵部分。數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)從數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)來看,主要分為以下幾個部分:①數(shù)據(jù)源。②數(shù)據(jù)的存儲與管理。③OLAP(聯(lián)機分析處理)服務(wù)器。④前端工具:主要包括各種報表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以數(shù)據(jù)挖掘及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。使用數(shù)據(jù)倉庫的好處

(1)倉庫中的數(shù)據(jù)按照一定的方式組織,從而使得信息容易存取并且有使用價值。(2)數(shù)據(jù)倉庫給各級單位帶來了巨大的變化。數(shù)據(jù)倉庫的建立給它們帶來了一些新的工作流程,其他的流程也因此而改變。(3)數(shù)據(jù)倉庫為各單位帶來了一些“以數(shù)據(jù)為基礎(chǔ)的知識”,它們主要應(yīng)用于對城市規(guī)劃與建設(shè)、尋找采用新方法和新措施的依據(jù)、市場戰(zhàn)略的評價,和為企業(yè)發(fā)現(xiàn)新的市場商機,同時,也用來控制庫存、檢查生產(chǎn)方法和定義用戶群。數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別

數(shù)據(jù)倉庫的出現(xiàn),并不是要取代數(shù)據(jù)庫。目前,大部分?jǐn)?shù)據(jù)倉庫還是用關(guān)系數(shù)據(jù)庫管理系統(tǒng)來管理的??梢哉f,數(shù)據(jù)庫、數(shù)據(jù)倉庫相輔相成、各有千秋。數(shù)據(jù)庫是面向事務(wù)的設(shè)計,數(shù)據(jù)倉庫是面向主題設(shè)計的。數(shù)據(jù)庫一般存儲在線交易數(shù)據(jù),數(shù)據(jù)倉庫存儲的一般是歷史數(shù)據(jù)。數(shù)據(jù)庫設(shè)計是盡量避免冗余,一般采用符合范式的規(guī)則來設(shè)計,數(shù)據(jù)倉庫在設(shè)計是有意引入冗余,采用反范式的方式來設(shè)計。數(shù)據(jù)庫是為捕獲數(shù)據(jù)而設(shè)計,數(shù)據(jù)倉庫是為分析數(shù)據(jù)而設(shè)計。

數(shù)據(jù)挖掘數(shù)據(jù)挖掘(DataMining),在人工智能領(lǐng)域,習(xí)慣上又稱為數(shù)據(jù)庫中知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。知識發(fā)現(xiàn)過程由以下三個階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)和解釋。數(shù)據(jù)挖掘可以與用戶或知識庫交互。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域(1)①分類(Classification)。②估值(Estimation)。③預(yù)言(Prediction)。④相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinitygroupingorassociationrules)。決定哪些事情將一起發(fā)生。⑤聚集(Clustering)。⑥描述和可視化(DescriptionandVisualization)。是對數(shù)據(jù)挖掘結(jié)果的表示方式。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域(2)以上6種數(shù)據(jù)挖掘的分析方法可以分為兩類:直接數(shù)據(jù)挖掘和間接數(shù)據(jù)挖掘?!ぶ苯訑?shù)據(jù)挖掘目標(biāo)是利用可用的數(shù)據(jù)建立一個模型,這個模型對剩余的數(shù)據(jù),對一個特定的變量(可以理解成數(shù)據(jù)庫中表的屬性,即列)進(jìn)行描述。間接數(shù)據(jù)挖掘目標(biāo)中沒有選出某一具體的變量,用模型進(jìn)行描述;而是在所有的變量中建立起某種關(guān)系。分類、估值、預(yù)言屬于直接數(shù)據(jù)挖掘;后三種屬于間接數(shù)據(jù)挖掘數(shù)據(jù)挖掘技術(shù)的工作過程①數(shù)據(jù)的抽取。②數(shù)據(jù)的存儲和管理。③數(shù)據(jù)的展現(xiàn)。在數(shù)據(jù)展現(xiàn)方面主要的方式有:查詢:實現(xiàn)預(yù)定義查詢、動態(tài)查詢、OLAP查詢與決策支持智能查詢;報表:產(chǎn)生關(guān)系數(shù)據(jù)表格、復(fù)雜表格、OLAP表格、報告以及各種綜合報表;可視化:用易于理解的點線圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化、動態(tài)模擬、計算機動畫技術(shù)表現(xiàn)復(fù)雜數(shù)據(jù)及其相互關(guān)系;統(tǒng)計:進(jìn)行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計分析;挖掘:利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關(guān)于數(shù)據(jù)關(guān)系和模式識別。數(shù)據(jù)挖掘的發(fā)展前景當(dāng)前數(shù)據(jù)挖掘應(yīng)用主要集中在電信、零售、農(nóng)業(yè)、網(wǎng)絡(luò)日志、銀行、電力、生物、天體、化工、醫(yī)藥等方面??此茝V泛,實際應(yīng)用還遠(yuǎn)沒有普及。而據(jù)有關(guān)專業(yè)報告指出,數(shù)據(jù)挖掘會成為未來10年內(nèi)重要的技術(shù)之一。而數(shù)據(jù)挖掘,也已經(jīng)開始成為一門獨立的專業(yè)學(xué)科。數(shù)據(jù)挖掘的發(fā)展應(yīng)是挖掘工具在先進(jìn)理論指導(dǎo)下的改進(jìn),而就目前情況而言,還有至少20年的發(fā)展空間。本章小結(jié)1.從上世紀(jì)50年代開始,數(shù)據(jù)管理技術(shù)產(chǎn)生并逐步進(jìn)入快速發(fā)展階段,直至70年代末經(jīng)歷了人工管理階段、文件系統(tǒng)階段、數(shù)據(jù)庫系統(tǒng)階段三個歷程。數(shù)據(jù)庫系統(tǒng)階段直到現(xiàn)在獲得到廣泛使用,主要是具有以下的優(yōu)點:數(shù)據(jù)結(jié)構(gòu)化;數(shù)據(jù)有很高的獨立性;數(shù)據(jù)共享性好,冗余度小并易于擴充;數(shù)據(jù)庫系統(tǒng)具有數(shù)據(jù)庫并發(fā)控制、數(shù)據(jù)恢復(fù)、數(shù)據(jù)安全性、數(shù)據(jù)完整性四個方面的數(shù)據(jù)控制功能。2.要學(xué)好數(shù)據(jù)庫技術(shù),首先熟悉其中的數(shù)據(jù)、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)庫系統(tǒng)四個最基本的概念。這些概念會貫穿在本教材的全部內(nèi)容中。本章小結(jié)3.?dāng)?shù)據(jù)庫技術(shù)一直在不斷的發(fā)展過程中,計算機領(lǐng)域的專家們對于數(shù)據(jù)庫技術(shù)的研究也從末中斷過,綜合起來,其研究領(lǐng)域主要集中在數(shù)據(jù)庫理論研究、數(shù)據(jù)庫管理系統(tǒng)軟件的研制、數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計與開發(fā)三個方面。4.目前新型數(shù)據(jù)庫的研發(fā)越來越多,應(yīng)用技術(shù)也越來越成熟,在最新發(fā)展中影響較大、成果較突出的主要體現(xiàn)在面向?qū)ο髷?shù)據(jù)庫的研制、數(shù)據(jù)倉庫技術(shù)、數(shù)據(jù)挖掘技術(shù)3個方面。面向?qū)ο髷?shù)據(jù)庫是數(shù)據(jù)庫發(fā)展的方向;數(shù)據(jù)倉庫技術(shù)對其定義、體系結(jié)構(gòu)、組成、建立步驟、數(shù)據(jù)倉庫作用、建立數(shù)據(jù)倉庫原因以及其對于數(shù)據(jù)集和數(shù)據(jù)庫的區(qū)別等問題作了說明;數(shù)據(jù)挖掘技術(shù)對其定義、起源、作用、關(guān)聯(lián)規(guī)則、技術(shù)實現(xiàn)方法和發(fā)展前景等問題作了介紹。習(xí)題一、選擇題1.文件倒排系統(tǒng)階段是屬于下列()。A.文件系統(tǒng)階段B.人工管理階段C.數(shù)據(jù)庫系統(tǒng)階段D.面向?qū)ο髷?shù)據(jù)庫發(fā)展階段2.()是用來實現(xiàn)數(shù)據(jù)庫系統(tǒng)的一些些操作,包括數(shù)據(jù)定義、數(shù)據(jù)操縱、數(shù)據(jù)查詢的數(shù)據(jù)控制等。A.DBMSB.DBC.DBSD.DBA3.可以把文字、圖形、圖像、聲音、各種具體數(shù)據(jù),按照一定的結(jié)構(gòu)存放起來,這些都是()A.DATAB.DBSC.DBD.其他4.具有數(shù)據(jù)獨立性和共享受性好、冗余度小的優(yōu)點發(fā)生在()階段。A.文件系統(tǒng)階段B.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論