協同數據庫綜合應用知識_第1頁
協同數據庫綜合應用知識_第2頁
協同數據庫綜合應用知識_第3頁
協同數據庫綜合應用知識_第4頁
協同數據庫綜合應用知識_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1數據庫系統與技術(9)

--協同數據庫及綜合應用信息科學與技術學院計算機科學系協同軟件研究開發(fā)中心2協同數據庫與綜合應用什么是協同?信息集成技術信息交換與發(fā)布綜合應用3協同數據庫與綜合應用什么是協同?協同——就是指協調兩個或者兩個以上的不同資源或者個體,協同一致地完成某一目標的過程或能力。協同范圍——不僅包括人與人之間的協作,也包括不同應用系統之間、不同數據資源之間、不同終端設備之間、不同應用情景之間、人與機器之間、科技與傳統之間等全方位的協同。

協同軟件——有助于協同的軟件4協同數據庫與綜合應用協同軟件技術:角色協同信息協同流程協同計算協同數據庫中的協同技術(信息協同)5信息集成數據集成——把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業(yè)提供全面的數據共享。信息集成解決的問題是把位于不同的異構信息源上的數據合并起來,以便為用戶提供一個統一的視圖。

信息集成的數據源可能是傳統數據庫,也可能是其他類型的信息,如網頁的集合。6信息集成“Informationintegration”一詞有信息集成、整合、融合的涵義,常見的表述有:信息集成是一種使相關的多元信息有機融合并優(yōu)化使用的理念。信息集成不是信息的堆積或信息載體的物理堆積。信息集成是一種多針對某個目標或面向某項特定服務對信息進行組織和管理的理念,集成的核心是資源作為大系統,采取技術手段進行整合,實現資源共享。信息集成不是簡單地從技術上實現各部門之間的信息共享,而是要從系統運行的角度,保證系統中每個部分、在運行的每個階段,都能將正確的信息、在正確的時間、正確的地點、以正確的方式、傳送給需要該信息的人。針對某一特定領域某一特定用戶的需求,以信息為對象,信息資源為本體,服務為動力,網絡技術為手段,協同作業(yè)為方法,把信息資源諸要素有機融合并使之優(yōu)化的動態(tài)過程,是一個優(yōu)化要素、體系重構的過程。7信息集成信息集成涉及到很多基礎問題的研究,如集成系統的邏輯框架、全局模式與局部模式的映射方法、異構信息源上的查詢推理和優(yōu)化、中間件/包裝器技術、半結構化數據等研究。目前通常采用聯邦式、基于中間件模型和數據倉庫等方法來構造集成的系統,這些技術在不同的著重點和應用上解決數據共享和為企業(yè)提供決策支持。8信息集成信息集成涉及到很多基礎問題的研究,如集成系統的邏輯框架、全局模式與局部模式的映射方法、異構信息源上的查詢推理和優(yōu)化、中間件/包裝器技術、半結構化數據等研究。目前通常采用聯邦式、基于中間件模型和數據倉庫等方法來構造集成的系統,這些技術在不同的著重點和應用上解決數據共享和為企業(yè)提供決策支持。9信息集成聯邦數據庫系統(FDBS)由半自治數據庫系統構成,相互之間分享數據,聯盟各數據源之間相互提供訪問接口,同時聯盟數據庫系統可以是集中數據庫系統或分布式數據庫系統。

10信息集成中間件模式通過統一的全局數據模型來訪問異構的數據庫、遺留系統、Web資源等。中間件位于異構數據源系統(數據層)和應用程序(應用層)之間,向下協調各數據源系統,向上為訪問集成數據的應用提供統一數據模式和數據訪問的通用接口。各數據源的應用仍然完成它們的任務,中間件系統則主要集中為異構數據源提供一個高層次檢索服務。中間件模式是目前比較流行的數據集成方法,它通過在中間層提供一個統一的數據邏輯視圖來隱藏底層的數據細節(jié),使得用戶可以把集成數據源看為一個統一的整體。這種模型下的關鍵問題是如何構造這個邏輯視圖并使得不同數據源之間能映射到這個中間層。

11信息集成數據倉庫是在在企業(yè)管理和和決策中面向向主題的、集集成的、與時時間相關的和和不可修改的的數據集合。。其中,數據據被歸類為廣廣義的、功能能上獨立的、、沒有重疊的的主題。這幾幾種方法在一一定程度上解解決了應用之之間的數據共共享和互通的的問題,但也也存在以下的的異同:聯邦邦數據庫系統統主要面向多多個數據庫系系統的集成,,其中數據源源有可能要映映射到每一個個數據模式,,當集成的系系統很大時,,對實際開發(fā)發(fā)將帶來巨大大的困難。數據倉庫技術術主要針對企企業(yè)某個應用用領域提出的的一種數據集集成方法,是是面向主題并并為企業(yè)提供供數據挖掘和決策支持的的系統。12信息交換信息交換是信信息協同的基基礎,也是所所有協同工作作的基礎。數據交換———指數據在不不同的信息實實體之間交互互的過程。數數據交換的目目的是屏蔽企企業(yè)之間或部部門之間的業(yè)業(yè)務系統在硬硬件平臺、操操作系統、網網絡協議和數數據源方面的的差異,為企企業(yè)提供一個個通用的數據據交換平臺。。13信息交換數據交換要解解決的關鍵問問題信息的統一表表示——信息息交換系統的的最終目標是是實現不同應應用系統間透透明的信息交交換,但是在在不同的應用用系統中,數數據的存儲、、表示方式可可能完全不同同。要解決這這一問題的關關鍵是要找到到數據的統一一表示方式,,XML標準的出現,,使基于統一一的規(guī)范格式式的信息交換換系統在實現現技術上已經經成為可能。。1415信息交換數據交換主要要技術傳統的方法::專門開發(fā)數據據交換接口總線和適配器器技術——各各個應用系統統通過適配器器與總線相連連,從而實現現相互之間的的數據交換。。但是,由于于企業(yè)或政府府部門都是用用已有的工具具或系統設計計表格、填寫寫表格、審批批表格,所以以信息的格式式、描述方法法、傳遞方式式都是不一樣樣的,在這樣樣的異構數據據源環(huán)境下,,要進行信息息交換還是十十分困難的。。1617信息交換XML用于數據交換換的優(yōu)勢簡單性。XML文檔是能進行行文件結構合合法性驗證的的純文本文檔檔,對于系統統間集成、交交換數據來說說,最簡單的的格式就是文文本??缙脚_性。XML可以在多種平平臺上使用,,可以用多種種工具進行解解釋,而且對對于幾種主要要的字符編碼碼標準都支持持,因而可在在全世界許多多不同的計算算環(huán)境中使用用。各系統只只要裝有相應應的XML解析工具,便便可以理解以以XML為中介由其它它系統傳遞過過來的信息并并加以利用。。可擴展性。即即允許用戶根根據需要定義義新的標簽的的能力。例如如可以使用XML制定應用領域域的集成、交交換標準。由于XML是可擴展的、、平臺獨立、、可支持國際際化及地區(qū)化化格式,它可可以通過標記記靈活地描述述數據,是天天生的信息共共享與信息交交換的數據格格式,從而可可以建立基于于XML的共享信息系系統,實現任任意應用系統統之間的信息息集成與交換換。18信息發(fā)布信息發(fā)布是指指信息的所有有者以一定的的方式提供自自己的全部或或一部分信息息,以供其他他用戶訪問使使用的行為。。1920信息發(fā)布根據發(fā)布信息息的不同方式式,Web信息發(fā)布分成成自主發(fā)布和和代理發(fā)布兩兩類。前者是信息提提供者直接發(fā)發(fā)布信息,其其他用戶無需需第三方的參參與就可以直直接訪問所發(fā)發(fā)布的信息;;后者則是信息息提供者通過過一些代理發(fā)發(fā)布信息,信信息在代理服服務器上注冊冊/注銷,而而用戶需要向向代理服務器器發(fā)出訪問請請求,由代理理處理請求并并返回用戶所所需要的信息息。21信息發(fā)布在第一代的WEB中,靜態(tài)HTML主頁是用的比比較多的一種種靜態(tài)信息發(fā)發(fā)布方式。HTML表示超文本標標記語言(HyperTextMarkup

Language),使用它可以使使頁面內容不不僅僅包括文文字,還有聲聲音、圖片、、視頻等,使使得信息變得得多樣化。任任何人想要發(fā)發(fā)布信息,只只需要購買一一個域名,然然后開一個WEB服務器或者租租用一個網上上空間,就可可以把制作好好的主頁放上上去,供別人人瀏覽獲取信信息。隨著Internet的發(fā)展,越來來越多的人加加入到網絡使使用者的行列列,他們也都都需要向外發(fā)發(fā)布信息。但但是自己建設設HTML主頁的費用比比較大,所以以這種方式并并不適合所有有人。而blog的興起,促成成了一個廉價價的解決方案案。Blog,中文譯名博客客,也叫網絡絡日志,是一一種適用于個個人用戶的出出版工具,具具有低成本、、低技術和方方便易用的特特點。用戶只只需要去blog提供商那里里注冊一個個帳號,就就可以馬上上擁有一個個個人的網網上空間。。而且blog非常容易使使用,用戶戶不需要懂懂任何的web技術,只要要在它提供供的寫作頁頁面里面輸輸入信息,,然后這些些信息就可可以發(fā)布出出來了,并并按照時間間的順序排排列起來,,別人就可可以總是獲獲取到新的的信息。22信息發(fā)布數據庫:由由傳統的數數據庫管理理系統組成成,可以是是各種異構構的數據庫庫系統和文文件系統,,或者數據據倉庫。它它們存儲了了要發(fā)布的的所有信息息,是一個個信息的倉倉庫。服務器:服服務器響應應用戶的請請求。在用用戶每次查查詢時,服服務器查詢詢數據庫,,并動態(tài)的的組織成一一定形式,,比如網頁頁或XML,供用戶使用用。用戶端:主主要為各種種瀏覽器,,或者胖客客戶端的程程序,它們們能夠發(fā)起起查詢請求求,并把服服務器返回回的結果顯顯示出來給給用戶查看看。顯而易見,,動態(tài)發(fā)布布的方式具具有很大的的優(yōu)點,因因為它能夠夠提供實時時的數據,,以支持協協同應用。。不過它的的缺點就是是技術比較較復雜,開開發(fā)維護的的費用比較較大。23數據庫綜合合應用現代信息系系統是:基于網絡平平臺的有知識處理理能力的支持多維數數據(時間間維等)的的具有強數據據模型、具具有高效的的信息處理理能力的綜合應用難以以單一一的數據庫庫技術建模模,需要綜綜合應用多多種數據庫庫技術、及及相關技術術,往往換換需要研究究新的技術術。電子政務、、電子商務務,現代信息服服務系統即時通信系系統,,,,24傳統的工資資確定和變變更是人事事部門工作作人員根據據工資政策策和員工的的人事信息息完成的。。由于工資資上報是人人事部門日日常性工作作,加上我我國現行的的工資政策策具有復雜雜性、時間間性、地域域性等主要要特點,該該項工作工工作量大、、容易出錯錯。工資時態(tài)知知識數據庫庫系統,也也稱為工資資智能決策策支持系統統(SIDSS),目標是將各各單位的人人事部門從從繁瑣的工工資調整工工作中解放放出來,不不再陷于成成堆的工資資政策中;;同時也可可以避免許許多人為造造成的錯誤誤,使工資資管理規(guī)范范化。SIDSS是一個綜合合多種數據據庫技術的的應用系統統,主要涉涉及面向對對象技術、、時態(tài)數據據庫技術、、主動數據據庫、知識識庫技術和和數據庫協協同工作等等。綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統25綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統26綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統27綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統工資的時態(tài)態(tài)數據模型型SIDSS中含有三類類信息:第第一類是不不影響工資資的信息,,如人員編編號、姓名名、身份證證號等;第第二類是影影響工資但但不受時間間影響的信信息,如參參加工作時時間等;第第三類是影影響工資也也受時間影影響的信息息,如學歷歷、職務晉晉升、工資資標準等。。一個教師的工資歷史記錄(時態(tài)數據)職務待遇工資檔次變動原因

執(zhí)行時間

助教

2

轉正定級

1995/7

助教

3

正常晉升

1998/10講師

2

職務晉升

1999/3

講師

3

正常晉升

2000/1028綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統工資政策時時態(tài)知識模模型工資政策是是一種典型型的時態(tài)知知識,其有有效性與時時間緊密相相關,人們們最常見的的是:“某某某政策從從XX年XX月XX日開始執(zhí)行行”。規(guī)則“TKRule_工資晉升””內容如下下:Rule:TKRule_工資晉升While_Event:MGet_上一次晉升升年份(ID)When:TC_ExpIf:TrueThen:M_確定晉升一一檔表6-12晉升政政策描述29綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統表6-12晉升政政策描述對象結構結構內容STK_IdTK_晉升STK_Description工資檔次晉升ValidTime[1993-10-1,+∞]Priority1TK_TriggerValidNomination(ID)TK_RuleTKRule_工資晉升MethodMGet_上一次晉升年份M_確定晉升一檔30綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統表6-12晉升政政策描述主動事件機機制為了保障系系統的正常常運行和工工資業(yè)務的的正常管理理,SIDSS系統中設計計了時態(tài)事事件處理器器實現工資資變更事務務。(1)事件件形式化表表達事件主要由由兩個表達達式描述::狀態(tài)表達達式和時間間表達式。。狀態(tài)表達式式通過人員員的現狀態(tài)態(tài)和變動條條件組合而而成。如::新職務工工資待遇>原職務工工資待遇。。時間表達式式主要是判判斷工資的的可變動性性,如:職職務變動時時間>原任任職時間And職務變動時時間>原工工資變動時時間31綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統表6-12晉升政政策描述(2)事件件處理器事件處理器器主要分為為事件生成成器、事件件排隊器、、事件調度度器和事件件處理子模模塊。32綜合應用實實例1—基基于時態(tài)知知識庫的工工資協同管管理系統表6-12晉升政政策描述事件排隊器器對事件進進行排隊的的工作流程程如下:step1:接收新事件件,根據新新事件的身身份參數判判斷該事件件應該進入入哪個隊列列。Step2:將新事件插插入隊列頭頭,如果該該隊列為空空,轉第6步;否則則轉第3步步。Step3:將新事件的的時間參數數與其隊列列后面的事事件的時間間參數作比比較,如果果新事件的的時間=舊舊事件的時時間,轉第第4步;如如果新事件件的時間>舊事件的的時間,將將新事件與與舊事件在在隊列中的的位置互換換,轉第5步;如果果新事件的的時間<舊舊事件的時時間,轉第第6步。Step4:將新事件的的優(yōu)先級與與舊事件的的優(yōu)先級作作比較,如如果新時間間的優(yōu)先級級>=舊事事件的優(yōu)先先級,轉第第6步;否否則將新事事件與舊事事件在隊列列中的位置置互換,轉轉第5步。。Step5:如果新事件件當前位置置是隊列的的尾部,轉轉第6步;;否則轉第第3步。Step6:事件排隊結結束。33中小型數據據中心實現現信息的智智能采集與與自動分類類、提供用用戶一個信信息使用的的協同交流流平臺。該該信息需要要綜合應用用Web數據庫、協協同數據庫庫、數據倉倉庫、數據據挖掘、主主動數據庫庫、實時數數據庫等技技術。綜合應用實實例2—中小型數據據中心系統統34綜合應用實實例2—中小型數據據中心系統統數據中心系系統功能::信息采集信息定期更更新用戶之間的的協作交流流協同信息檢檢索數據中心的的協同特點點主要包括括:支持信息共共享支持用戶異異步交流支持協同信信息檢索。。35綜合應用實實例2—中小型數據據中心系統統36綜合應用實實例2—中小型數據據中心系統統1)信息智智能采集與與自動分類類。搜索引引擎自動從從互聯網搜搜索信息,,所搜索到到的資源通通過信息封封裝、版本本控制、自自動分類與與建立本地地索引才能能放進數據據中心內部部。2)信息使使用。用戶可進行行協同信息息檢索、信信息查閱、、信息發(fā)布布、信息評評分、信息息評論、信信息審核等等操作。對對于感興趣趣的信息,,還可以訂訂閱、收藏藏該信息,,或把該信信息推薦給給相關用戶戶。授權用用戶可以設設置信息的的訪問權限限。此外,,授權用戶戶可配置數數據中心的的基礎設置置。3)數據中中心。由數數據庫跟文文件系統組組成,存放放用戶相關關信息、互互聯網上下下載下來的的資源及其其相關信息息、用戶之之間的協同同信息等等等數據。37綜合應用實實例2—中小型數據據中心系統統4.系統實實現技術(1)搜索引擎擎搜索引擎的的相關信息息配置在XML文檔中,在在搜索的初初始階段,,通過XMLParser讀取相關的的配置信息息,對搜索索引擎進行行初始化。。搜索引擎擎設計程多多線程模式式。因為互互聯網是一一個巨大的的數據庫,,Internet上的頁面數數以億計,,信息量非非常巨大,,而建立一一個搜索連連接通常要要花費一定定的時間,,為了加快快搜索速度度,本模塊塊設計成多多線程模型型,同時為為了提高系系統的性能能,采用線線程池技術術,每一線線程負責一一個搜索任任務,當該該線程完成成一個任務務或者連接接超時的時時候,則提提供給下一一個搜索任任務使用。。38綜合應用實實例2—中小型數據據中心系統統(2)自動分類類智能分類采采用最大熵熵模型來實實現。最大大熵模型就就是擬合所所有已知事事實,保持持對未知事事件的未知知狀態(tài)。換換而言之,,就是給定定一些事實實集,選擇擇一種模型型與現有事事實一致,,對于未知知事件則盡盡可能使其其分布均勻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論