數(shù)據(jù)庫概論 數(shù)據(jù)庫系統(tǒng)簡介_第1頁
數(shù)據(jù)庫概論 數(shù)據(jù)庫系統(tǒng)簡介_第2頁
數(shù)據(jù)庫概論 數(shù)據(jù)庫系統(tǒng)簡介_第3頁
數(shù)據(jù)庫概論 數(shù)據(jù)庫系統(tǒng)簡介_第4頁
數(shù)據(jù)庫概論 數(shù)據(jù)庫系統(tǒng)簡介_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)庫概論數(shù)據(jù)庫系統(tǒng)簡介什么是信息在數(shù)學上是確定性的度量,兩次不定性之差,與隨機對立猜猜32只球隊誰是冠軍?折半查找,猜5次,log232按奪冠概率高低劃分組,可以用更少次數(shù)找到誰是冠軍最大熵原理當對一個隨機事件的概率分布進行預測時,預測應當滿足全部已知的條件,而對未知的情況不要做任何主觀假設。這種情況下,概率分布最均勻,熵最大,預測的風險最小對一個一無所知的骰子,其各面朝上的概率均為1/6;如果一個面朝上的概率為1/3,則其余五個面朝上的概率分別是2/15不要把所有的雞蛋放在一個籃子里,當遇到不確定性時,就要保留各種可能性,將風險降到最小誰是黑桃A?三張撲克牌,猜中黑桃A為贏當你選定一張牌后,對方從剩余的兩張牌中打開一張不是黑桃A的給你看,問你此時是否應該改變選擇?猜背面顏色三張卡片,A兩面紅色,B兩面黑色,C一面紅一面黑。隨機抽出一張,如果看到的一面是紅色,另一面也是紅色的概率是多少?思考:卡片不可能是B,是A或C的概率相同,是A則另一面是紅色,是C則另一面是黑色,所以背面是紅色的概率是1/2。對否?A1A2B1B2C1C2已知某酒鬼有90%的日子都會出去喝酒,喝酒只去固定三家酒吧。今天警察找了其中兩家酒吧都沒有找到酒鬼。

問:酒鬼在第三家酒吧的幾率?已知某家庭有兩個孩子,其中老大是女孩。

問:另外一個是女孩的幾率?已知某家庭有兩個孩子,其中一個是女孩。

問:另外一個是女孩的幾率?貝葉斯定理:月暈而風礎潤而雨事件A:這水果是蘋果;事件B:這水果是圓的一座別墅在過去20年里一共發(fā)生過2次被盜,別墅的主人有一條狗,狗平均每周晚上叫3次,在盜賊入侵時狗叫的概率為0.9,問在狗叫時發(fā)生入侵的概率是多少?律師也需要數(shù)學!肇事車顏色假設某城市80%出租車是黑色的,20%是黃色的,當肇事車是黃色的,目擊者有80%的概率聲稱它是黃色的;當肇事車是黑色的,目擊者有80%的概率聲稱它是黑色的;當目擊者聲稱是黃色的時,它是黃色的可能性有多大?(50%)當目擊者聲稱是黑色的時,它是黑色的可能性有多大?(16/17)某種疾病發(fā)病率為1/%,化驗的準確率95/%,當化驗結果為陽性時,患病幾率多大?A:陽性B:患病貝葉斯定理應用:醫(yī)療診斷我只不過說了一個大家都知道的事實一個島上有100個人,其中有5個紅眼睛,95個藍眼睛。這個島有三個奇怪的宗教規(guī)則他們不能照鏡子,不能看自己眼睛的顏色他們不能告訴別人對方的眼睛是什么顏色。一旦有人知道了自己是紅眼睛,他必須在當天夜里自殺某天,有個旅行者到了這個島上。由于不知道這里的規(guī)矩,所以他在和全島人一起狂歡的時候,不留神就說了一句話:【你們這里有紅眼睛的人?!考僭O這個島上的人足夠聰明,每個人都可以做出縝密的邏輯推理。請問這個島上將會發(fā)生什么?信息級聯(lián):依次決策的誤區(qū)集群實驗設置:依次猜球顏色裝有3個小球的小罐,兩紅一藍(多數(shù)紅色)和兩藍一紅(多數(shù)藍色)的可能性相同,都是50%每個學生依次背向大家拿出一個球,看清顏色后放回,猜測罐中是多數(shù)紅色還是多數(shù)藍色,并向大家宣布他的猜測后面的同學看不到前面同學抓到的球的顏色,但能聽到他的猜測結果信息是一種能量熱力學第一定律:熱功轉換開啤酒瓶口有白氣信息是一種能量熱力學第二定律:熵增加熱寂說,時間之矢最大熵:分子運動論Maxiwell精靈It’sallfrombit!1比特信息操作最少增加kBln2的熵兩次google搜索的碳排放等于燒開1壺水S=klog百變精靈:信息面面觀信息是不確定性的消除信息是負熵

信息是有序性的度量信息是系統(tǒng)組織程度的度量信息是事物之間的差異信息是使概率分布發(fā)生變動的東西信息是被反映的物質屬性信息是通訊傳輸?shù)膬?nèi)容信息是人與外界相互作用過程中所交換的內(nèi)容社會熵佛渡有緣人生物熵什么是數(shù)據(jù)對現(xiàn)實世界中客觀事物的符號表示數(shù)字、文本、聲音、圖像計算機中數(shù)據(jù)能輸入計算機,并能為其處理的符號序列數(shù)據(jù)項是數(shù)據(jù)記錄中最小的、不可分的有名數(shù)據(jù)單位(姓名,性別)數(shù)據(jù)元素由若干個數(shù)據(jù)項組成學生(學號,姓名,系別…)羽毛學者信息與數(shù)據(jù)的聯(lián)系數(shù)據(jù)是信息的符號表示,或稱載體信息是數(shù)據(jù)的內(nèi)涵,是數(shù)據(jù)的語義解釋數(shù)據(jù)是符號化的信息信息是語義化的數(shù)據(jù)例,一幅黑白圖象數(shù)據(jù)——黑白點陣信息——臉譜Data的拉丁解釋:已知、事實數(shù)據(jù)語義語言:形式語義:內(nèi)涵1101081980010100x?莊子與惠子游于濠梁之上,莊子曰:“鰷魚出游從容,是魚之樂也?!被葑釉唬骸白臃囚~,安知魚之樂?”,莊子曰:“子非我,安知我不知魚之樂?”惠子曰:“我非子,固不知子矣;子固非魚也,子之不知魚之樂,全矣。”莊子曰:“請循其本。子曰‘女安知魚樂’云者,既已知吾知之而問我,我知之濠上也?!比绾喂蚕頂?shù)據(jù)?知識:薪火相傳“行動的能力”,“知識就是力量”“可以輔助我們作出決策或采取行動的有很高價值的一種信息形態(tài)”

知識管理學習型組織、知識共享悖論:教會徒弟,餓死師傅感知信息學習知識信息:剛才吃了五彩麻辣燙知識:色彩鮮艷的昆蟲有毒大數(shù)據(jù)之矢:知識發(fā)現(xiàn)知識普惠萬物生靈Why?:數(shù)據(jù)管理藝術的必然What?:數(shù)據(jù)模型How?:數(shù)據(jù)庫模式tripleV(veni,vidi,vici)我來、我見、我征服triple?:Why?What?How?提綱回溯——數(shù)據(jù)管理的發(fā)展階段數(shù)據(jù)模型數(shù)據(jù)庫模式數(shù)據(jù)庫系統(tǒng)構成數(shù)據(jù)庫發(fā)展方向資治通鑒:似曾相識燕歸來Turnpoint飄戰(zhàn)爭與和平悲慘世界日瓦戈醫(yī)生靜靜的頓河英雄:崢嶸歲月顯身手蕓蕓眾生:大歷史河流上泛起的小浪花信息系統(tǒng)的原始雛形結繩記事那么,數(shù)據(jù)管理的內(nèi)涵是什么?假定你要開發(fā)一個圖書館信息管理系統(tǒng),你首先需要搞清楚的最基本的事實是:加工對象是誰?加工流程如何運轉?對象:圖書、學生、管理員……操作:入庫、借閱、預約、催還…所以你的任務是:如何定義一個對象?如何實現(xiàn)一項操作?數(shù)據(jù)結構隆重出場按照邏輯關系組織起來的一批數(shù)據(jù),按一定的存儲方法把它存儲在計算機中,并在這些數(shù)據(jù)上定義了一個運算的集合邏輯結構數(shù)據(jù)之間存在的邏輯關系表、樹、圖、數(shù)組…物理結構數(shù)據(jù)在計算機內(nèi)的存儲方式順序方式、鏈接方式…編程起點:聲明變量的數(shù)據(jù)類型具有相同數(shù)據(jù)結構的數(shù)據(jù)屬同一類,同一類數(shù)據(jù)的全體稱為一個數(shù)據(jù)類型數(shù)據(jù)類型說明了數(shù)據(jù)在數(shù)據(jù)分類中的歸屬,用以限定該數(shù)據(jù)的變化范圍有何問題?恒定與綁定的量子糾纏良好的數(shù)據(jù)結構加上糟糕的代碼遠勝于糟糕的數(shù)據(jù)結構加上良好的代碼信息系統(tǒng)開發(fā)的普世之道圭臬:數(shù)據(jù)結構+算法=程序孜孜以求之:數(shù)據(jù)獨立性數(shù)據(jù)獨立性當數(shù)據(jù)的結構發(fā)生變化時,通過系統(tǒng)提供的映象(轉換)功能,使應用程序不必改變數(shù)據(jù)的物理獨立性當數(shù)據(jù)的存儲結構發(fā)生變化時,使應用程序不必改變數(shù)據(jù)的邏輯獨立性當數(shù)據(jù)的邏輯結構發(fā)生變化時,使應用程序不必改變開發(fā)信息系統(tǒng)需要哪些數(shù)據(jù)管理功能?數(shù)據(jù)定義邏輯結構+物理結構數(shù)據(jù)操縱查詢:事物自身的屬性+事物之間的聯(lián)系更新:插入、刪除、修改數(shù)據(jù)約束對客觀事物的合理反映,數(shù)據(jù)一致性死亡日期不早于出生日期數(shù)據(jù)獨立性的實現(xiàn)視角:

將數(shù)據(jù)管理從應用程序中剝離出來數(shù)據(jù)管理:信息系統(tǒng)的心臟作業(yè)層管理層決策層信息收集系統(tǒng)數(shù)據(jù)管理系統(tǒng)決策支持系統(tǒng)原始信息數(shù)據(jù)決策信息形式化歸納信息系統(tǒng)數(shù)據(jù)管理對數(shù)據(jù)的分類、組織、編碼、存儲、檢索和維護數(shù)據(jù)管理的發(fā)展階段考察要點各階段的技術及應用背景計算機應用范圍外存儲設備數(shù)據(jù)管理軟件各個階段的差別體現(xiàn)誰管理數(shù)據(jù)數(shù)據(jù)面向誰數(shù)據(jù)與應用的獨立性應運而生雛鳳清于老鳳聲數(shù)據(jù)管理征途的星辰大海人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)人工管理階段計算機主要用于科學計算數(shù)據(jù)量小、結構簡單,如高階方程、曲線擬和等外存為順序存取設備磁帶、卡片、紙帶,沒有磁盤等直接存取設備沒有操作系統(tǒng),沒有數(shù)據(jù)管理軟件用戶用機器指令編碼,通過紙帶機輸入程序和數(shù)據(jù),程序運行完畢后,由用戶取走紙帶和運算結果,再讓下一用戶上機操作人工管理階段訪問訪問訪問數(shù)據(jù)1數(shù)據(jù)2數(shù)據(jù)n程序1程序2程序n人工管理階段的特點用戶完全負責數(shù)據(jù)管理工作數(shù)據(jù)的組織、存儲結構、存取方法、輸入輸出等數(shù)據(jù)完全面向特定的應用程序每個用戶使用自己的數(shù)據(jù),數(shù)據(jù)不保存,用完就撤走數(shù)據(jù)與程序沒有獨立性存取數(shù)據(jù)的子程序隨著存儲結構的改變而改變磁帶的特點優(yōu)點:廉價地存放大容量數(shù)據(jù)缺點:順序訪問;1%所需,100%訪問文件系統(tǒng)階段計算機不但用于科學計算,還用于管理外存有了磁盤、磁鼓等直接存取設備直接存取設備(DASD)無須順序存取由地址直接訪問所需記錄產(chǎn)生了操作系統(tǒng)管理和控制計算機軟硬件資源的計算機程序文件系統(tǒng)的功能文件存儲空間的管理目錄管理文件讀寫管理文件保護向用戶提供操作接口文件系統(tǒng)解放了用戶對外存的訪問數(shù)據(jù)1數(shù)據(jù)2數(shù)據(jù)n存取方式程序1程序2程序n文件系統(tǒng)提供了一定的物理獨立性補貼系別姓名學號勞資科住址系別性別姓名學號房產(chǎn)科學位學分系別姓名學號學籍科學位出身年齡系別性別姓名學號人事科學校的文件系統(tǒng)文件系統(tǒng)的數(shù)據(jù)定義獨立性數(shù)據(jù)與程序緊密結合,數(shù)據(jù)的邏輯結構改變則必須修改應用程序數(shù)據(jù)分散管理,許多文件,許多數(shù)據(jù)格式數(shù)據(jù)的語義信息只能由程序來解釋,數(shù)據(jù)怎么組織,以及數(shù)據(jù)取出來之后按什么含義應用,只有全權管理它的程序知道一個應用若想共享另一個應用生成的數(shù)據(jù),必須同另一個應用溝通,了解數(shù)據(jù)的語義與組織方式信息孤島信息集成文件系統(tǒng)的數(shù)據(jù)完整性獨立性由于數(shù)據(jù)存在很多副本,給數(shù)據(jù)的修改與維護帶來了困難,容易造成數(shù)據(jù)的不一致性數(shù)據(jù)完整性難于維護性別必須是男或女員工工資不能超過其經(jīng)理每門課選修人數(shù)不能超過100…文件系統(tǒng)的數(shù)據(jù)操作獨立性數(shù)據(jù)查詢困難記錄之間無聯(lián)系用戶自己編程實現(xiàn)對每個查詢都重新編碼本質困難:面對一串字符流,要從中找到目標對象,你需要對其解析、遍歷、匹配……文件系統(tǒng)眼中的數(shù)據(jù):字符流示例

S(SNO,SNAME,STATUS,CITY) P(PNO,PNAME,COLOR,WEIGHT,CITY) J(JNO,JNAME,CITY) SPJ(SNO,PNO,JNO,QTY)S表示供應商,各屬性依次為供應商號,供應商名,供應商狀態(tài)值,供應商所在城市;P表示零件,各屬性依次為零件號,零件名,零件顏色,零件重量,零件存放的城市;J表示工程,各屬性依次為工程號,工程名,工程所在城市;SPJ表示供貨關系,各屬性依次為供應商號,零件號,工程號,供貨數(shù)量。供應商項目零件供應憶苦思甜查詢供應紅色零件給北京的工程的供應商姓名供應零件數(shù)量最多的供應商使用了三種不同零件的工程……維護約束不允許供應不存在的零件單一工程使用零件的總數(shù)量不超過100……青銅世紀——基于文件系統(tǒng)查詢分別組織幾個文件,存儲各類對象的記錄CreateFile(S,P,J,SPJ)ScanFile(P)找到紅色零件的號碼ScanFile(J)找到北京的工程的號碼ScanFile(SPJ)找到對應以上兩號碼的SNOScanFile(S)找到對應以上SNO的供應商姓名adhocquery基于文件系統(tǒng)維護數(shù)據(jù)完整性如果InsertFile(SPJ)ScanFile(P)判斷欲插入的零件號是否在P中如果DeleteFile(P)ScanFile(SPJ)判斷欲刪除的零件號是否在SPJ中數(shù)據(jù)庫系統(tǒng)階段計算機管理的數(shù)據(jù)量大,關系復雜,共享性要求強(多種應用、不同語言共享數(shù)據(jù))外存有了大容量磁盤,光盤軟件價格上升,硬件價格下降,編制和維護軟件及應用程序成本相對增加,其中維護的成本更高,力求降低專門的數(shù)據(jù)管理軟件呼之欲出斯人不出如蒼生何數(shù)據(jù)庫的上帝視角數(shù)據(jù)的本質是什么?數(shù)據(jù)不是依賴于處理過程的附屬品,而是現(xiàn)實世界中獨立存在的對象數(shù)據(jù)1統(tǒng)一存取數(shù)據(jù)2數(shù)據(jù)n程序2程序1程序n見,或者不見我就在那里不悲不喜學號姓名性別系別年齡住址出身學位學分補貼學籍科房產(chǎn)科人事科勞資科學校的數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng)階段的特點有了數(shù)據(jù)庫管理系統(tǒng)面向全組織,面向現(xiàn)實世界獨立性較強由DBMS統(tǒng)一存取,維護數(shù)據(jù)語義及結構面向全組織的數(shù)據(jù)結構支持全企業(yè)的應用而不是某一個應用數(shù)據(jù)反映了客觀事物間的本質聯(lián)系,而不是著眼于面向某個應用,是有結構的數(shù)據(jù)文件系統(tǒng)只是記錄的內(nèi)部有結構,一個文件的記錄之間是個線性序列,記錄之間無聯(lián)系數(shù)據(jù)庫系統(tǒng)眼中的數(shù)據(jù):結構化數(shù)據(jù)數(shù)據(jù)的冗余度小,易擴充冗余度小:數(shù)據(jù)面向整個系統(tǒng),而不是面向某一應用,數(shù)據(jù)集中管理,數(shù)據(jù)共享集中管理的優(yōu)點:節(jié)省存儲空間,減少存取時間,避免數(shù)據(jù)之間的不相容性和不一致性易擴充性:每個應用選用數(shù)據(jù)庫的一個子集,只要重新選取不同子集或者加上一小部分數(shù)據(jù),就可以滿足新的應用要求數(shù)據(jù)庫的高數(shù)據(jù)獨立性舉措一:把數(shù)據(jù)庫定義和描述從應用程序中分離出去舉措二:數(shù)據(jù)描述是分級的(全局邏輯、局部邏輯、存儲)舉措三:數(shù)據(jù)存取由系統(tǒng)管理,用戶不必考慮存取路徑等細節(jié),從而簡化了應用程序統(tǒng)一的數(shù)據(jù)控制功能安全性控制(Security)保護數(shù)據(jù)以防止不合法的使用所造成的數(shù)據(jù)泄露和破壞措施:用戶標識與鑒定,存取控制完整性控制(Integrity)數(shù)據(jù)的正確性、有效性、相容性措施:完整性約束條件定義和檢查統(tǒng)一的數(shù)據(jù)控制功能并發(fā)控制(Concurrency)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論