網(wǎng)絡(luò)技術(shù)(光纖網(wǎng)絡(luò)協(xié)議等)的發(fā)展課件_第1頁
網(wǎng)絡(luò)技術(shù)(光纖網(wǎng)絡(luò)協(xié)議等)的發(fā)展課件_第2頁
網(wǎng)絡(luò)技術(shù)(光纖網(wǎng)絡(luò)協(xié)議等)的發(fā)展課件_第3頁
網(wǎng)絡(luò)技術(shù)(光纖網(wǎng)絡(luò)協(xié)議等)的發(fā)展課件_第4頁
網(wǎng)絡(luò)技術(shù)(光纖網(wǎng)絡(luò)協(xié)議等)的發(fā)展課件_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1MetadataInstructor:E-mail:SemanticWeb&Ontology謝謝觀賞2019-9-132OutlineWhyMetadataWhat’sMetadataWhat’sXMLQuestion謝謝觀賞2019-9-133URI,HTML,HTTPStaticWWW500millionusermorethan3billionpages2.1CurrentWeb謝謝觀賞2019-9-134快速發(fā)展的因素電腦技術(shù)的快速發(fā)展電腦的普及電腦知識的普及網(wǎng)絡(luò)技術(shù)(光纖、網(wǎng)絡(luò)協(xié)議等)的發(fā)展

帶寬的提高校園網(wǎng)、電信的ISDL用戶對資源的需求

知識的需求娛樂信息謝謝觀賞2019-9-135引發(fā)一系列問題(1)

信息發(fā)布

網(wǎng)絡(luò)IP地址的分配問題產(chǎn)生虛擬IP網(wǎng)絡(luò)、IPV6等方法來解決

信息獲取

如何從這些海量信息中查到自己感興趣的資源如何獲取這些信息產(chǎn)生搜索引擎、信息挖掘技術(shù)

信息存儲如何存儲海量信息產(chǎn)生磁盤陣列、TB級存儲器謝謝觀賞2019-9-136引發(fā)一系列問題(2)信息傳遞

采用何種工具傳遞網(wǎng)絡(luò)信息

產(chǎn)生FTP、BT等軟件

信息使用

如何合法、正確使用網(wǎng)絡(luò)信息

產(chǎn)生網(wǎng)絡(luò)信息監(jiān)管的職能部門和法規(guī)產(chǎn)生針對用戶(如兒童)權(quán)限等的信息過濾技術(shù)

謝謝觀賞2019-9-137Web信息結(jié)構(gòu)

大部分采用HTML(HyperTextMarkupLanguage)也采用XML(eXtensibleMarkupLanguage)

HTML標記語言是在普通文本的基礎(chǔ)上加上特殊標記(Tag)目的是運用標記使文件達到預期的顯示效果方法是用“<”、“>”擴住標記,起始標記用<Tag>表示,終止標記用</Tag>表示

謝謝觀賞2019-9-138HTML網(wǎng)頁片斷(1)

<TABLEborder=0cellPadding=0cellSpacing=0width=720><TBODY><TR><TDwidth=61><Ahref="/"><IMGalt=虛擬中醫(yī)網(wǎng)border=0height=67src="default.files/logo1.gif"width=61></A></TD><TABLE>一個容器標記,用以指明這是表格,其它表格標記只能在這個標記范圍內(nèi)使用

<TR>表示表格的行。<TD>表示表格行中的單元。

謝謝觀賞2019-9-139HTML網(wǎng)頁片斷(2)

<framesetrows=“80,*”><framename=“top”src=“a.html”/><framename=“bottom”src=“b.html”/></frameset><frameset>用來劃分框格,每個框格由一個<frame>標記來表示

這里把頁面分成上下兩部分,上面顯示a.html,下面顯示b.html謝謝觀賞2019-9-13102.2搜索引擎

從1995年開始逐漸發(fā)展

產(chǎn)生原因

用戶要在如此浩瀚的信息海洋里尋找信息,必然會“大海撈針”無功而返。搜索引擎正是為了解決這個"迷航"問題而出現(xiàn)的技術(shù)

目的

以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息

對信息進行理解、提取、組織和處理

為用戶提供檢索服務

謝謝觀賞2019-9-1311現(xiàn)有的搜索引擎

中文搜索引擎英文搜索引擎

百度中文搜索引擎Google搜索引擎北大天網(wǎng)中英文搜索引擎聰搜索引擎雅虎中國分類搜索引擎搜狐分類搜索引擎新浪搜索引擎

網(wǎng)易分類目錄引擎

英文Google搜索引擎Inktomi/MSN搜索引擎

Fast/AllTheWeb搜索引擎AltaVista搜索引擎ASK/Temoa

搜索引擎英文Yahoo!分類目錄Dmoz

人工分類目錄LookSmart

分類目錄

謝謝觀賞2019-9-1312Google簡介斯坦福大學的博士生

LarryPage和

SergeyBrin在

1998年創(chuàng)立

搜索時間通常不到半秒

每天需要提供

1.5億次查詢服務

Google的技術(shù)

代理搜索技術(shù)

高級

PageRank(網(wǎng)頁級別)技術(shù)

Google釋義

由英文單詞“googol”變化而來

表示

1后邊帶有

100個零的數(shù)字

代表Google想征服網(wǎng)上無窮無盡資料的雄心

PageRank利用巨大的網(wǎng)絡(luò)鏈接結(jié)構(gòu)

網(wǎng)頁

A鏈接到網(wǎng)頁

B時,

就認為“網(wǎng)頁

A投了網(wǎng)頁

B一票避免任何人為感情因素

謝謝觀賞2019-9-1313百度搜索引擎簡介李彥宏先生及徐勇先生

1999年底,百度成立于美國硅谷

2000年百度公司回國發(fā)展

百度的起名

辛棄疾的《青玉案》中“眾里尋她千百度”象征著百度對中文信息檢索技術(shù)執(zhí)著的追求

競價排名由用戶為自己的網(wǎng)頁出資購買關(guān)鍵字排名按點擊計費的一種服務搜索結(jié)果的順序?qū)⒏鶕?jù)競價的多少由高到低排列謝謝觀賞2019-9-1314雅虎搜索引擎簡介大衛(wèi)·費羅(DavidFilo)和楊致遠(JerryYang)美國斯坦福大學電機工程系的博士生

1994年4月建立了網(wǎng)絡(luò)指南信息庫

分類目錄

站點目錄分為14個大類,每一個大類下面又分若干子類

連接速度快,包含范圍廣

雅虎中國網(wǎng)站提供簡單易用、手工分類的簡體中文網(wǎng)站目錄

謝謝觀賞2019-9-1315性能指標

召回率(Recall)檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率衡量的是搜索引擎的查全率

精度(Pricision)

檢索出的相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率

衡量的是搜索引擎的查準率

影響性能的因素

文檔和查詢的表示方法評價文檔用戶查詢相關(guān)性的匹配策略查詢結(jié)果的排序方法用戶進行相關(guān)度反饋的機制

謝謝觀賞2019-9-1316搜索引擎的類別

分類依據(jù)

信息搜集方法

服務提供方式

類別

目錄式搜索引擎

機器人搜索引擎

元搜索引擎

謝謝觀賞2019-9-1317目錄式搜索引擎

搜集信息

人工方式或半自動方式

信息處理

由編輯員查看信息之后,人工形成信息摘要并將信息置于事先確定的分類框架中

服務方式提供目錄瀏覽服務

提供直接檢索服務

優(yōu)點討論缺點討論代表

YAHOO

、LookSmart、Dmoz等

謝謝觀賞2019-9-1318機器人搜索引擎

搜集信息

蜘蛛(Spider)的機器人程序

以某種策略自動地在互聯(lián)網(wǎng)中搜集信息

信息處理建立索引庫

服務方式

面向網(wǎng)頁的全文檢索服務

優(yōu)點

討論缺點討論代表

Google

、天網(wǎng)等謝謝觀賞2019-9-1319元搜索引擎

技術(shù)方法將用戶的查詢請求同時向多個搜索引擎遞交

將返回的結(jié)果進行重復排除、重新排序等處理

作為自己的結(jié)果返回給用戶

服務方式面向網(wǎng)頁的全文檢索

本質(zhì)特點沒有自己的數(shù)據(jù)

優(yōu)點討論缺點討論代表WebCrawler、InfoMarket等

謝謝觀賞2019-9-1320搜索引擎系統(tǒng)結(jié)構(gòu)

搜索器索引器檢索器用戶接口謝謝觀賞2019-9-1321搜索器

功能在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息

盡可能多、盡可能快地搜集各種類型的新信息

定期更新已經(jīng)搜集過的舊信息

搜集策略從一個起始URL集合開始,以寬度優(yōu)先、深度優(yōu)先或啟發(fā)式方式循環(huán)地在互聯(lián)網(wǎng)中發(fā)現(xiàn)信息將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡搜索

信息類型

HTML、XML、FTP文件、字處理文檔、多媒體信息

其它支撐技術(shù)分布式、并行計算技術(shù)

謝謝觀賞2019-9-1322索引器

功能理解搜索器所搜索的信息從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表

索引項

客觀索引項內(nèi)容索引項

支撐技術(shù)統(tǒng)計法、信息論法和概率法(計算索引項的權(quán)值)

倒排表(InversionList),由索引項反過來查找相應的文檔

可以使用集中式索引算法或分布式索引算法

謝謝觀賞2019-9-1323檢索器

方法根據(jù)用戶的查詢在索引庫中快速檢出文檔進行文檔與查詢的相關(guān)度評價對將要輸出的結(jié)果進行排序并實現(xiàn)某種用戶相關(guān)性反饋機制如何實現(xiàn)多點的海量檢索(討論)集中式海量檢索分布式海量檢索謝謝觀賞2019-9-1324用戶接口

作用輸入用戶查詢顯示查詢結(jié)果提供用戶相關(guān)性反饋機制

目的方便用戶使用搜索引擎高效率、多方式地從搜索引擎中得到有效、及時的信息簡單接口只提供用戶輸入查詢串的文本框復雜接口

讓用戶對查詢進行限制,如邏輯運算、時間、長度等例子Google提供多種用戶使用界面謝謝觀賞2019-9-1325搜索引擎的研究動向

提高信息查詢結(jié)果的精度,提高檢索的有效性基于智能代理的信息過濾和個性化服務采用分布式體系結(jié)構(gòu)提高系統(tǒng)規(guī)模和性能交叉語言檢索的研究和開發(fā)國際會議美國Infornotics公司主辦的搜索引擎國際會議從1996年開始,每年舉行一次IEEE主辦的國際萬維網(wǎng)會議、人機交互會議謝謝觀賞2019-9-1326當前搜索引擎的不足之處(1)1)語義分析不足,缺少較好的中文分詞技術(shù)支持

用google搜索引擎,關(guān)鍵詞“和服”,在第3頁有如下結(jié)果:外交部公布新版中國境外領(lǐng)事保護和服務指南

...

外交部公布新版中國境外領(lǐng)事保護和服務指南(附全文),

中國外交部通過其官方網(wǎng)站公布了《中國境外領(lǐng)事保護和服務指南(2003

年版)》,以幫助中國公民了解中國駐外使、領(lǐng)館的領(lǐng)事保護和服務范圍。

...

謝謝觀賞2019-9-1327當前搜索引擎的不足之處(2)2)智能化不足

都需要用戶提供檢索的關(guān)鍵詞、關(guān)鍵詞組,但還不能直接檢索語句

要直接檢索語句,需要更強的自然語言處理技術(shù)支持謝謝觀賞2019-9-13282.3Web信息提取

從提取規(guī)則角度,網(wǎng)頁信息提取方法可分為兩大類基于標識規(guī)則的方法應用網(wǎng)頁文檔的標識來提取網(wǎng)頁信息基于內(nèi)容規(guī)則的方法應用自然語言處理技術(shù)從關(guān)鍵詞匹配到有層次的句法分析謝謝觀賞2019-9-1329基于標識規(guī)則的方法

Harvest信息提取系統(tǒng)利用手工編寫的wrappers分析一批固定的Web資源只能處理Web文檔而忽略了Internet上提供的服務依賴于提前定義的文檔類型,對新文檔結(jié)構(gòu)則無能為力斯坦福大學提出的對象交換模型(OEM)方法一個簡單的、自描述、嵌套的對象模型一個帶標記的有向圖這個模型依賴于具體問題的分析DSE(Data-richsectionextraction)算法用樹型結(jié)構(gòu)表示HTML網(wǎng)頁的布局

實質(zhì)是針對具體問題建立文檔對象模型,提取網(wǎng)頁信息

謝謝觀賞2019-9-1330基于內(nèi)容規(guī)則的方法

Artequakt系統(tǒng)

建立在自然語言處理技術(shù)和實體論基礎(chǔ)上通過句法和語義分析來確定實體及關(guān)系根據(jù)用戶要求,產(chǎn)生描述格式,從而描述出藝術(shù)家傳記DL(descriptionlogics)方法

建立在實體論基礎(chǔ)上用DL方法從詞匯關(guān)系、概念關(guān)系和上下文關(guān)系,抽取概念及其依賴關(guān)系樹

DiffusionwebIE系統(tǒng)

依照實例模型(又稱IE規(guī)則)構(gòu)出的框架依據(jù)關(guān)鍵詞位置和值的特征的定位規(guī)則依據(jù)詞類型和取值范圍的表格提取規(guī)則句法分析規(guī)則

謝謝觀賞2019-9-1331兩種方法比較基于標識的方法不具有自適應能力準確定位信息段的起止位置基于內(nèi)容的方法不易準確定位信息段的起止位置有一定自適應能力依賴較強的自然語言處理技術(shù)謝謝觀賞2019-9-1332信息提取的研究趨勢融合兩種規(guī)則一些網(wǎng)頁信息提取方法把這兩種規(guī)則融合在一起以求充分發(fā)揮著兩種提取規(guī)則的特點來提高提取效率語義網(wǎng)

改變現(xiàn)有網(wǎng)頁信息結(jié)構(gòu)XML語言把信息結(jié)構(gòu)、內(nèi)容與數(shù)據(jù)的表現(xiàn)形式進行分離RDF把信息轉(zhuǎn)換成元數(shù)據(jù)本體論把信息的結(jié)構(gòu)與內(nèi)容相分離信息具有計算機可理解的語義

謝謝觀賞2019-9-13332.4元數(shù)據(jù)

定義

dataaboutdata(關(guān)于數(shù)據(jù)的數(shù)據(jù))是對web信息的一種描述方式是機器可理解的信息

基本作用

管理數(shù)據(jù),從而實現(xiàn)查詢、閱讀、交換和共享組成

一系列元素或?qū)傩岳樱簣D書館目錄如:作者,書名,出版日期,主題,分類排架號等元素謝謝觀賞2019-9-1334元數(shù)據(jù)與資源之間的關(guān)聯(lián)方式

獨立方式元素可包含在獨立于該項資源的記錄中

例如:圖書館目錄

嵌入方式數(shù)據(jù)可嵌在資源本身中

例如:印在書內(nèi)封上的在版編目(CIP)數(shù)據(jù)例如:電子文本的標題

關(guān)聯(lián)方式的確定不預先規(guī)定

由具體情況決定

謝謝觀賞2019-9-1335元數(shù)據(jù)的主要作用

用來組織和管理網(wǎng)絡(luò)信息,并挖掘信息資源

準確地識別、定位和訪問信息(舉例討論)幫助用戶查詢所需信息

可按照不同的地理區(qū)間、指定的語言以及具體的時間段來查找信息資源(舉例討論)組織和維護一個機構(gòu)對數(shù)據(jù)的投資

可方便創(chuàng)建網(wǎng)頁(舉例討論)用來建立信息的數(shù)據(jù)目錄和數(shù)據(jù)交換中心

可以共享信息、維護數(shù)據(jù)(舉例討論)提供數(shù)據(jù)轉(zhuǎn)換方面的信息通過元數(shù)據(jù),用戶可以接受并理解信息(舉例討論)謝謝觀賞2019-9-1336如何獲取元數(shù)據(jù)

元數(shù)據(jù)的編寫標準

目的為實現(xiàn)領(lǐng)域中的數(shù)據(jù)信息交換和共享,為研究和生產(chǎn)服務

不同領(lǐng)域會根據(jù)不同的需求定義一個標準或幾個標準

如MARC(Machine-ReadabIeCataloging,機器可讀編目)和DublinCore等

實現(xiàn)的技術(shù)手段

XMLRDF謝謝觀賞2019-9-1337XML技術(shù)特點從數(shù)據(jù)與文檔的底層實現(xiàn)格式化,保證了從里到外、從處理到交換的一致性

實現(xiàn)自動抽取采用XML解析器開發(fā)的工具,可以從網(wǎng)上Web服務器的HTML、XML和數(shù)據(jù)庫中自動抽取并索引元數(shù)據(jù)

謝謝觀賞2019-9-1338RDF

技術(shù)元數(shù)據(jù)的互操作性要求在由不同的組織制定與管理且技術(shù)規(guī)范不盡相同的元數(shù)據(jù)環(huán)境下,能夠作到對用戶保持一致性的服務

可同時攜帶多種元數(shù)據(jù)來往于互聯(lián)網(wǎng)的架構(gòu)

RDF特點提供能對結(jié)構(gòu)化元數(shù)據(jù)進行編碼,交換及再利用的體系框架

可使不同的用戶或團體在這一框架下定義他們自己的元數(shù)據(jù)元素提供了各種不同的元數(shù)據(jù)體系之間的互操作性

謝謝觀賞2019-9-1339元數(shù)據(jù)映射(MetadataMapping)

原因存在元數(shù)據(jù)的互操作性問題

定義利用特定轉(zhuǎn)換程序?qū)Σ煌獢?shù)據(jù)標準進行轉(zhuǎn)換

方法一(元數(shù)據(jù)標準的特定轉(zhuǎn)化程序)DublinCore與USMARCDublinCore與EA方法二(中介元數(shù)據(jù)格式)如UNIverse項目利用GRS格式進行MARC格式和其他記錄格式的轉(zhuǎn)換比較方法一轉(zhuǎn)換準確、轉(zhuǎn)換效率較高謝謝觀賞2019-9-1340元數(shù)據(jù)類型

內(nèi)容元數(shù)據(jù)

描述對象內(nèi)容的信息

如大字標題、主題、引導段落、圖像、影片

管理元數(shù)據(jù)

描述和電子文檔相關(guān)的信息

如作者、創(chuàng)建者、創(chuàng)建日期等

負載信息元數(shù)據(jù)

提供電子文檔的物理屬性

如文本中表示強調(diào)的粗體標識,電子郵件系統(tǒng)中郵件的大小標識

參考信息元數(shù)據(jù)源自電子文檔中的超鏈接

擴展到表達任何萬維網(wǎng)信息、文檔和資源的參考鏈接

包括環(huán)境信息,以及文檔的結(jié)構(gòu)信息

如經(jīng)常出現(xiàn)電子文檔中指向各章節(jié)的鏈接

謝謝觀賞2019-9-1341元數(shù)據(jù)表示語言

標記語言

標準通用標記語言SGML超文本標記語言HTML可擴展標記語言XML虛擬現(xiàn)實模型語言VRML無線標記語言WML元數(shù)據(jù)標準

DublinCoreHL7(描述醫(yī)學網(wǎng)絡(luò)資源的元數(shù)據(jù))教育資源元數(shù)據(jù)

機讀目錄(MARC)

謝謝觀賞2019-9-1342SGML

標準通用標記語言是一種描述語言的語言,定義了以電子形式表示文本的方法

特點

正式的,能允許驗證文檔的正確性

結(jié)構(gòu)化的,能夠處理復雜的文檔

可擴充的,能夠支持大型信息存儲的管理

組成部分SGML聲明,設(shè)定基本情況定義DTD文檔類型,設(shè)定標記語言結(jié)構(gòu)的語法描述用于標記的語義規(guī)格說明,做出了DTD表達的語法限制描述用于標記的語義規(guī)格說明,做出了DTD表達的語法限制應用實例HTML、XML謝謝觀賞2019-9-1343其它標記語言虛擬現(xiàn)實模型語言VRML用于對3維虛擬場景進行建模的描述性語言

HTML定義2維,而VRML定義3維

無線標記語言

WML類似于HTML的測覽語言提供測覽支持、數(shù)據(jù)輸入、超級鏈接、文本和圖像表現(xiàn)以及表格交互應用于“無線應用軟件”環(huán)境下的網(wǎng)頁語言為WAP(WirelessApplicationProtocol)協(xié)議所包括的一種標記協(xié)議語言

謝謝觀賞2019-9-1344DublinCore元數(shù)據(jù)標準

背景搜索引擎的查準率比較低創(chuàng)建者OCLC(OnlineComputerLibraryCenter,Inc.,美國在線計算機圖書館中心)目的從用戶的角度出發(fā)創(chuàng)建了一種新的網(wǎng)絡(luò)資源描述標準或格式第一次國際研討會

1995年3月,在都柏林(Dublin)召開

探討如何建立一套描述網(wǎng)絡(luò)上電子文件特征、提高信息檢索效果的方法

開始啟動電子圖書館對象元數(shù)據(jù)標準的研究項目

謝謝觀賞2019-9-1345DC元數(shù)據(jù)集

包括15個核心元素

按照信息的類型和范圍分為三個子集數(shù)據(jù)資源內(nèi)容

數(shù)據(jù)知識產(chǎn)權(quán)

數(shù)據(jù)實體

特點簡練、易于理解、可擴展能與其他元數(shù)據(jù)形式兼容被稱為一個良好的網(wǎng)絡(luò)信息資源描述元數(shù)據(jù)集

謝謝觀賞2019-9-1346數(shù)據(jù)資源內(nèi)容子集

元素定義TITLE(數(shù)據(jù)集名稱)由數(shù)據(jù)生產(chǎn)者或分發(fā)者確定的數(shù)據(jù)集名稱SUBJECT(主題)數(shù)據(jù)集的主題,可以是說明數(shù)據(jù)集主題或內(nèi)容的關(guān)鍵字或短語,最好使用規(guī)定的縮寫詞或統(tǒng)一分類名稱DESCRIPTION(描述)數(shù)據(jù)集內(nèi)容的簡要說明SOURCE(數(shù)據(jù)源)生產(chǎn)數(shù)據(jù)集的原始資料說明,包括原始資料出版日期、生產(chǎn)者、格式、標識碼或其他說明信息LANGUAGE(語言)數(shù)據(jù)集使用的語言,該元素的內(nèi)容應當與“語言標識碼”標準(RFC1766)一致,如en(英國)、de(德國)、fr(法國)等RELATION(關(guān)系)其他生產(chǎn)者標識碼及其與數(shù)據(jù)生產(chǎn)者之間的關(guān)系COVERAGE(時空覆蓋范圍)數(shù)據(jù)集內(nèi)容的空間和時間覆蓋范圍??臻g覆蓋范圍可以用坐標或地名表示;時間范圍是指數(shù)據(jù)的現(xiàn)勢性,按ISO8601日期和時間格式標準,即YYYY-MM-DD謝謝觀賞2019-9-1347數(shù)據(jù)知識產(chǎn)權(quán)子集

元素定義CREATOR(數(shù)據(jù)生產(chǎn)者)負責生產(chǎn)數(shù)據(jù)的主要單位或個人PUBLISHER(出版者)將數(shù)據(jù)集提供用戶使用的負責單位,如出版社等CONTRIBUTOR(其他生產(chǎn)者)除數(shù)據(jù)生產(chǎn)者元素中說明以外的其他參與生產(chǎn)者(如編輯、轉(zhuǎn)換等)RIGHTS(版權(quán))版權(quán)說明。與版權(quán)管理聲明鏈接的標識碼,或與提供數(shù)據(jù)集版權(quán)管理信息的服務鏈接的標識碼謝謝觀賞2019-9-1348數(shù)據(jù)實體(形式)子集

元素定義DATE(日期)數(shù)據(jù)集生產(chǎn)或提供使用的日期,按ISO8601日期和時間格式標準,即YYYY-MM-DDTYPE(類型)數(shù)據(jù)集的類型FORMAT(格式)數(shù)據(jù)集的數(shù)據(jù)格式,用于識別顯示或操作數(shù)據(jù)集的軟件及硬件。IDENTIFIER(標識碼)唯一標識數(shù)據(jù)集的字符串或數(shù)字,對于聯(lián)網(wǎng)數(shù)據(jù)資源,包括URL和URN,或ISBN謝謝觀賞2019-9-1349DCMI

DCMI(DublinCoreMetadataInitiative)都柏林核元數(shù)據(jù)研究行動已經(jīng)成為一個國際性的電子數(shù)據(jù)對象標準研究組織有來自英國、澳大利亞、芬蘭、加拿大、美國等國的具有多種不同專業(yè)背景的個人和團體參加從事元數(shù)據(jù)標準、實踐指南、支撐技術(shù)及相關(guān)政策的研究與開發(fā)成立了一個教育工作組DC-E從數(shù)字圖書館元數(shù)據(jù)標準中篩選出上述DC中的15個核心元素作為學習對象數(shù)據(jù)要素謝謝觀賞2019-9-1350HL7(HealthLevel7)

開發(fā)機構(gòu)

1987年,由美國國家標準局(ANSI)授權(quán)的HL7(HealthLevelSevenInc)開發(fā)領(lǐng)域?qū)iT用于醫(yī)療衛(wèi)生機構(gòu)及醫(yī)用儀器、設(shè)備數(shù)據(jù)信息傳輸?shù)臉藴手С值膰以?994年HL7已納入美國ANSI國家標準

澳洲、加拿大、德國、以色列、日本、紐西蘭、荷蘭及英國

用途適用于醫(yī)院內(nèi)部的信息交換適用于醫(yī)院與醫(yī)院之間,醫(yī)院與保險公司、醫(yī)院與上級主管部門之間的大量信息交換

謝謝觀賞2019-9-1351HL7技術(shù)參考了OSI的通訊模式

HL7納為最高的一層,也就是應用層

謝謝觀賞2019-9-1352HL7標準的內(nèi)容(1)

Ch1:Introduction(概述與HL7歷史)Ch2:Control(控制)Ch3:PatientAdministration(病患管理,掛號)Ch4:Orders(醫(yī)令)Ch5:Query(查詢)Ch6:FinancialManagement(病患帳務)Ch7:ObservationReporting(檢驗報告?zhèn)魉?Ch8:MasterFiles(參考檔同步機制)謝謝觀賞2019-9-1353HL7標準的內(nèi)容(2)Ch9:MedicalRecords/Info.Management(病歷)Ch10:Scheduling(排程)Ch11:PatientReferral(轉(zhuǎn)診)Ch12:PatientCare(病患看護)附錄A:DataDefinitionTables(參考表)附錄B:LowerLayerProtocol(LLP)附錄C:NetworkManagement附錄D:BNFMessageDescriptions附錄E:Glossary謝謝觀賞2019-9-1354HL7特點可應用于多種操作系統(tǒng)和硬件環(huán)境

所有不同平臺的醫(yī)院信息管理系統(tǒng)通過HL7都可以順利溝通

設(shè)備可以做到無縫聯(lián)接和醫(yī)學數(shù)據(jù)信息的無障礙交換

匯集了的一些標準接口格式針對不同廠商設(shè)計應用軟件謝謝觀賞2019-9-1355教育資源元數(shù)據(jù)

IEEELOM

學習對象元數(shù)據(jù)

IMS教學管理系統(tǒng)

CELTS

中國教育信息化技術(shù)標準

謝謝觀賞2019-9-1356IEEELOM

(1)由IEEE學習技術(shù)標準委員會P1484.12學習對象元數(shù)據(jù)工作組建立

目的使用最小屬性集完成對學習對象的管理、檢索和評估便于將來對其屬性進行擴展

目標定義學習對象元數(shù)據(jù)的語法與語義對安全、隱私、商業(yè)和評估等應用提供了描述符學習對象指一切可為教學和培訓目的服務的對象

可以是物理的:如實驗器材、課本

可以是數(shù)字的:如教學軟件,網(wǎng)絡(luò)課件

謝謝觀賞2019-9-1357IEEELOM

(2)元素

9個基本類別(即通用類、生命周期類、宏元數(shù)據(jù)類、技術(shù)類、教育類、權(quán)利類、注解類、關(guān)系類、分類類)

每個類別包括若干元素

對每個元素定義了其名稱、解釋、值域、數(shù)據(jù)類型、附注和示例

作用

在不操作學習對象的情況下通過元數(shù)據(jù)信息來了解學習對象的一些有用的屬性

可以對學習對象進行有效的分類管理和查找

可以從元數(shù)據(jù)信息中獲取學習對象的評價信息,也可以把自己的評價加入到元數(shù)據(jù)

謝謝觀賞2019-9-1358IMS

1997年美國EDUCOM(美國多所大學聯(lián)合組成的聯(lián)盟

)專門對電子學習(e-Learning劫標準進行研究項目目的能達成各校間網(wǎng)絡(luò)化教材的共享目標達成分布式學習環(huán)境下之應用系統(tǒng)或服務的互操作性,定義、發(fā)展所需的技術(shù)規(guī)范協(xié)助其他單位,將IMS規(guī)范納人產(chǎn)品或服務中主要任務主要發(fā)展和推廣有關(guān)教育的開放規(guī)范促進線上分布式的學習活動

如搜尋和使用教育用途的內(nèi)容、追蹤學習者的學習進度

性質(zhì)并非開放性組織

所制定的規(guī)范還未成為正式的標準

謝謝觀賞2019-9-1359IMS

規(guī)范用于內(nèi)容描述、發(fā)現(xiàn)和交換的規(guī)范

IMS內(nèi)容包裝說明(IMSContentPackagingSpecification)IMS問題與測試互操作性說明(IMSQuestion&TestInteroperabilitySpecification)IMS學習資源元數(shù)據(jù)說明(IMSLearningResourceMetadataSpecification)數(shù)字資源庫互操作(DigitalRepositoriesInteroperability)

用于內(nèi)容交互與跟蹤的規(guī)范

簡易串序/簡易排序(SimpleSequencing)

能力(Competencies)

學習設(shè)計(LearningDesign)

可用性(Accessibility)

用于應用系統(tǒng)互操作的規(guī)范IMS學習者信息包裝說明(IMSLearnerInformationPackageSpecification)IMS企業(yè)說明(IMSEnterpriseSpecification

謝謝觀賞2019-9-1360中國教育信息化技術(shù)標準

2001年開始啟動

基于LOM

目標

實現(xiàn)資源共享支持系統(tǒng)互操作保障網(wǎng)絡(luò)教育服務質(zhì)量

方法跟蹤國際標準研究工作和引進相關(guān)國際標準根據(jù)我國教育的實際情況修訂與創(chuàng)建各項標準

謝謝觀賞2019-9-1361CELTS

體系《學習對象元數(shù)據(jù)》(CELTS-3)規(guī)定了描述學習對象的基本方法與準則屬于CELTS體系中的基礎(chǔ)標準《教育資源建設(shè)技術(shù)規(guī)范》(CELTS-41)面向資源建設(shè)領(lǐng)域包括基礎(chǔ)教育、高等教育、職業(yè)教育和培訓等領(lǐng)域)是對《學習對象元數(shù)據(jù)》與具體應用領(lǐng)域結(jié)合的產(chǎn)物

《基礎(chǔ)教育教學資源元數(shù)據(jù)規(guī)范》(CELTS-42)應用領(lǐng)域則更為具體主要面向基礎(chǔ)教育的資源建設(shè)關(guān)系一脈相承的都是以LOM為核心建立的謝謝觀賞2019-9-1362機讀目錄(MARC)

廣泛用于圖書館書目記錄數(shù)據(jù)

是目前圖書館描述、存儲、交換、處理以及檢索信息的基礎(chǔ)

特點

可變長字段的記錄格式采用目次方式每條MARC記錄分三個區(qū)(頭標區(qū),目次區(qū),數(shù)據(jù)區(qū))

謝謝觀賞2019-9-13632.5XML

性質(zhì)W3C于1998年2月發(fā)布的一種標準

是SGML的一個簡化子集

可擴展標記語言特點較好地解決了HTML無法表達數(shù)據(jù)內(nèi)容等問題允許各個組織、個人建立適合自己需要的標記集合

謝謝觀賞2019-9-1364XML與HTML比較文檔的3個要素數(shù)據(jù)、結(jié)構(gòu)以及顯示方式

HTML顯示方式內(nèi)嵌在數(shù)據(jù)中

在創(chuàng)建文本時,要時時考慮輸出格式

創(chuàng)建文檔的重復工作量大

不易抽取語義信息

XML顯示格式從數(shù)據(jù)內(nèi)容中獨立出來,保存在樣式單文件(StyleSheet)中

自我描述性質(zhì)能夠很好地表現(xiàn)許多復雜的數(shù)據(jù)關(guān)系

謝謝觀賞2019-9-1365XML結(jié)構(gòu)

文件頭

與HTML類似,是可選的文件主體

包括一個或多個元素

形式是一棵分級的樹

混雜的“結(jié)尾部分”

由注釋、處理指令和空白組成

注釋用<!----!>表示,可在文檔中任意位置

謝謝觀賞2019-9-1366元素(Element)

表示方法由開始標記、結(jié)束標識以及標識之間的數(shù)據(jù)構(gòu)成

標記之間的數(shù)據(jù)被認為是元素的值

每個元素都有不同的標記名<director>王力</director>元素名是director元素值是“王力”

<actor>王力</actor>元素名是actor元素值是“王力”謝謝觀賞2019-9-1367元素要點關(guān)鍵的3點

所有元素必須有結(jié)束標記

所有元素必須正確嵌套,不允許交迭

所有屬性值必須加引號

注意點XML文檔主體有且僅有一個XML根元素

可以嵌套XML元素,形成一棵樹形結(jié)構(gòu)

謝謝觀賞2019-9-1368XML文檔例子<書類><書國際標準書號="0345374827"><標題>數(shù)據(jù)結(jié)構(gòu)</標題><作者>許卓群等</作者></書><書國際標準書號="0345374828"><標題>數(shù)據(jù)挖掘</標題><作者>韓家炸等</作者></書></書類>謝謝觀賞2019-9-1369例子的樹狀結(jié)構(gòu)

謝謝觀賞2019-9-1370XML屬性

給元素提供進一步的說明信息

必須出現(xiàn)在起始標記中

以名稱/取值對出現(xiàn),屬性名不能重復名稱與取值之間用等號“=”分隔用引號把取值引起來

例如

<工資貨幣="人民幣元">100000</工資>說明了工資的貨幣單位是人民幣元

謝謝觀賞2019-9-1371XML處理器

目的解析XML文檔提供對XML文檔內(nèi)容和結(jié)構(gòu)的訪問

文檔對象模型(DocumentObjectModel,DOM)將完整的XML轉(zhuǎn)換成一棵樹的形式放在內(nèi)存中

供隨機訪問元素、屬性

XML簡單API(SimpleAPIforXML,SAX)采用事件驅(qū)動模型

通過標記的起止來觸發(fā)事件

DOM與SAX的比較(討論)謝謝觀賞2019-9-1372處理指令(ProcessingInstruction)

目的給XML處理器提供信息,使其能夠正確解釋文檔內(nèi)容表示起始標記是“<?”,結(jié)束標記是“?>”方法XML分析器把這些信息原封不動地傳給應用程序

由應用程序來解釋這個指令

遵照它所提供的信息進行處理

謝謝觀賞2019-9-1373兩種處理指令XML聲明

<?Xmlversion="1.0"encoding="gb2312"standalone="no"?>必須包括version屬性,指明所采用的XML的版本號,而且它必須在屬性列表中排在第一位standalone屬性表明該XML文檔是否和一個外部文檔類型定義DTD配套使用

encoding屬性則指明了數(shù)據(jù)所采用的編碼標準

XSL樣式單引用

<?xml-stylesheettype=“text-xsl”href=“contacts.xsl”?>告訴XSL樣式單解析器,樣式單的類型是text-xsl

類型text-xsl可以在文檔contacts.xsl中找到

謝謝觀賞2019-9-1374XML的名字空間

背景由于XML對互操作性的支持,每個人都可以創(chuàng)建屬于自己的XML詞匯

不同的開發(fā)者會用相同的元素來代表不同的實體

作用為XML文檔元素提供了一個上下文

允許開發(fā)者按一定的語義來處理元素

為什么引入NS(命名空間)討論謝謝觀賞2019-9-1375XMLNS例子<?xmlversion="1.0"?><hamburgersxmlns:purchase=/franchise/pricesxmlns:sales=/customer/prices><hamburgerlowfat="dreamon"><name>CowBurger</name><description>Greasyandgood.</description><purchase:price>0.99</price><sales:price>2.99</price></hamburger></hamburgers>謝謝觀賞2019-9-1376XSL(ExtensibleStylesheetLanguage)

背景用標準的DOMAPI來實現(xiàn)XML數(shù)據(jù)的交互,是十分單調(diào)乏味的

如想找到所有滿足某些條件的元素,或轉(zhuǎn)換為簡單的HTML表格,必須手工書寫代碼遍歷整棵樹來尋找

目的為標準化及簡化人們完成這些任務所需做的工作

謝謝觀賞2019-9-1377食品的例子

XML文檔<?xmlVersion="1.0"?><食品><食品脂肪含量="低"><名稱>月餅</名稱><描述>中秋節(jié)食用的傳統(tǒng)食品</描述><價格>2.99</價格></食品><食品>

HTML文檔<html><body><h1>食品</hl><o1><li>月餅,中秋節(jié)的傳統(tǒng)食品,2元</li></o1></body></html>謝謝觀賞2019-9-1378XSL文件

<?xmlVersion="1.0"?><xsl:stylesheetxmlns:xsl="/TR/WD-xsl">

<xsl:templatematch="/">選取了當前結(jié)點的所有食品子結(jié)點

<html><body><hl>hamburgers</hl><xsl:for—eachselect="hamburgers[@lowfat="dreamon"]">

標識出符合給定條件的結(jié)點

<li><xsl:value-ofselect="name"/>,<xsl:value-ofselect="description"/>,<xsl:value-ofselect="price"/>

取結(jié)點中各個元素的值</li></xsl:for—each><body><html></xsl:template></xsl:stylesheet>謝謝觀賞2019-9-1379XSL用途增強了互操作性

XML數(shù)據(jù)轉(zhuǎn)換為HTML從一種XML格式到另一種XML格式之間的轉(zhuǎn)換

開發(fā)人員不用為了描述某種類型的數(shù)據(jù)而采用通用的詞匯某個人向你的系統(tǒng)發(fā)送了一篇XML文檔,而你的系統(tǒng)不認識它所采用的XML詞匯只要進行一次簡單的XSL轉(zhuǎn)換就可以得到自己熟悉的詞匯謝謝觀賞2019-9-1380文檔類型定義

DTD

目的定義XML文檔結(jié)構(gòu),即其中的元素、屬性以及元素之間關(guān)系的

定義了文件中的元素能用什么名字,能放在什么位置,應該怎樣組合

可以檢測XML文檔的結(jié)構(gòu)是否正確

例如描述一組<表>,其中每個<表>又可以包含若干個<項>DTD中應該有語句:<!ELEMENT表(項)+><!ELEMENT項(#PCDATA)>生成的表:<表><項>管樂</項><項>弦樂</項><項>器樂</項><表>謝謝觀賞2019-9-1381DTD引用內(nèi)部引用包含在XML文檔的前導說明部分

如<?xmlversion="1.0"encoding="GB2312"standalone="yes"?><!DOCTYPE根元素名[元素描述]>

文檔體…外部引用作為一個外部文檔被引用

如<?xmlversion="1.0"encoding="GB2312"standalone="no"?><!DOCTYPE根元素名SYSTEM"外部DTD文件的URL">

文檔體…SYSTEM指一個作者或組織所編寫的通用的DTD或是<!DOCTYPE根元素PUBLIC"DTD名稱""外部DTD的URL">PUBLIC指由權(quán)威機構(gòu)制訂的、提供給特定行業(yè)或公眾使用的DTD

謝謝觀賞2019-9-1382DTD中ETD(元素類型聲明)作用聲明所有有效的文檔元素

結(jié)構(gòu)

<!ELEMENT元素名元素內(nèi)容描述>類型

空元素類型

<!ELEMENT元素名EMPTY>使用空元素標記,元素中沒有內(nèi)容

ANY元素類型

元素中可以包含任何內(nèi)容

父元素類型

元素中可以包含子元素在DTD中通過正則表達式規(guī)定子元素出現(xiàn)的順序和次數(shù)

混合元素類型

<!ELEMENT元素名(#PCDATA|子元素名1|子元素名2|…)>元素中可以包含文本文本之間可以有選擇地插入子元素,子元素出現(xiàn)的順序和次數(shù)不受限制

謝謝觀賞2019-9-13832.6XMLSchema

DTD缺點采用了非XML的語法規(guī)則不支持數(shù)據(jù)類型擴展性較差XML模式己經(jīng)漸有取代DTD的趨勢擁有比DTD更強大的功能

用于更精確和有效地描述XML文檔結(jié)構(gòu)謝謝觀賞2019-9-1384XML模式的優(yōu)點一致性直接借助XML自身的特性利用XML的基本語法規(guī)則定義XML文檔的結(jié)構(gòu)不必再利用一種特定的形式化的語言擴展性

引入了數(shù)據(jù)類型、命名空間在基本數(shù)據(jù)類型基礎(chǔ)上用戶可自己擴展數(shù)據(jù)類型互換性

利用模式能夠書寫XML文檔并驗證文檔的合法性

對不同的模式進行轉(zhuǎn)換,以實現(xiàn)更高層次的數(shù)據(jù)交換

規(guī)范性

利用元素的內(nèi)容和屬性來定義XML文檔的整體結(jié)構(gòu)基于XML,更具有規(guī)范性

謝謝觀賞2019-9-1385數(shù)據(jù)類型

用途為ElementType和AttributeType指定數(shù)據(jù)類型

基本數(shù)據(jù)類型(10種)entity,entities,enumeration,id,idref,idrefs,nmtoken,nmtokens,notation和string擴展數(shù)據(jù)類型

bin.baSe64,bin.heX,boolean,char,date,dateTime,dateTime.tz,fixed.14.4,float,int,number,timetime.tz,i1,i2,i4,r4,r8,ui1,ui2,ui4,uri,uuid

謝謝觀賞2019-9-1386XMLS元素類型基本格式

<ElementTypecontent="{|empty|textOnly|eltOnly|mixed}"dt:type="datatype"model="{open|closed}"name="idref"order="{one|seq|many}“>

</ElementType>取值及含義

(略)謝謝觀賞2019-9-1387XMLS屬性類型基本格式

<AttributeTypedefault="default-value"dt:type="primitive-typedt:values="enumerated-values"name="idref"required="{yes|no}">取值及含義

(略)謝謝觀賞2019-9-1388數(shù)據(jù)類型的使用例子(1)定義元素“名字”和“生日”<elementname="name"type="string"minOccurs="1"maxOccurs="1"/><elementname="birthday"type="date"minOccurs="1"maxOccurs="1"/>其中string和date類型都是Schema中自帶的基本數(shù)據(jù)類型minOccurs和maxOccurs是最少和最多出現(xiàn)次數(shù)的約束,這里表示有而且只出現(xiàn)一次

謝謝觀賞2019-9-1389數(shù)據(jù)類型的使用例子(2)擴展數(shù)據(jù)類型Schema中沒有規(guī)定的類型,如“性別”類型

定義例子

<simpleTypename="性別"><restrictionbase="string"><enumerationvalue="男"/><enumerationvalue="女"/></restriction></simpleType>注釋name屬性是該數(shù)據(jù)類型的名稱

數(shù)據(jù)類型由restriction子元素進行約束該元素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論