知識(shí)圖譜:算法與實(shí)踐 課件 第1-5章 -概述、知識(shí)表示- 實(shí)體消歧_第1頁(yè)
知識(shí)圖譜:算法與實(shí)踐 課件 第1-5章 -概述、知識(shí)表示- 實(shí)體消歧_第2頁(yè)
知識(shí)圖譜:算法與實(shí)踐 課件 第1-5章 -概述、知識(shí)表示- 實(shí)體消歧_第3頁(yè)
知識(shí)圖譜:算法與實(shí)踐 課件 第1-5章 -概述、知識(shí)表示- 實(shí)體消歧_第4頁(yè)
知識(shí)圖譜:算法與實(shí)踐 課件 第1-5章 -概述、知識(shí)表示- 實(shí)體消歧_第5頁(yè)
已閱讀5頁(yè),還剩661頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章:知識(shí)圖譜概述《知識(shí)圖譜》配套講義提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)人工智能的三個(gè)階段計(jì)算智能運(yùn)算和存儲(chǔ)能力感知智能感知是人和動(dòng)物通過(guò)感覺(jué)器官與自然界進(jìn)行交互的能力視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等認(rèn)知智能特指人在感知世界以及人與人互動(dòng)的過(guò)程中形成的、對(duì)世界萬(wàn)物的理性認(rèn)識(shí),包括記憶、概括、推理等。認(rèn)知智能與知識(shí)密不可分。4知識(shí)工程在人工智能中占據(jù)核心地位什么是知識(shí)Plato:是永恒不變的且適用于世間萬(wàn)物的真理。Davenportr:是與經(jīng)驗(yàn)(Experience)、背景(Context)、解釋(Interpretation)和思考(reflection)結(jié)合在一起的信息,是一種可以隨時(shí)幫助人們決策與行動(dòng)的高價(jià)值信息。Harris:是信息、文化脈絡(luò)及經(jīng)驗(yàn)的組合。什么是知識(shí)Feigenbaum:是經(jīng)過(guò)消減、塑造、解釋和轉(zhuǎn)換的信息,即知識(shí)就是經(jīng)過(guò)加工的信息。Bernstein:由特定領(lǐng)域的描述、關(guān)系和過(guò)程組成。Hayes-Roth:是事實(shí)、信念和啟發(fā)式規(guī)則。Nonaka:分為兩種,其中顯式知識(shí)指可以用正式、系統(tǒng)化的語(yǔ)言傳輸?shù)闹R(shí);而隱性知識(shí)擁有個(gè)性化的特征,很難進(jìn)行形式化描述和分享。數(shù)據(jù),信息和知識(shí)數(shù)據(jù)反映客觀事物運(yùn)動(dòng)狀態(tài)的感知信號(hào),可以是符號(hào)、文字、數(shù)字、語(yǔ)音、圖像、視頻等,是人腦感知的最原始的記錄,未經(jīng)加工和解釋,與其他數(shù)據(jù)沒(méi)有聯(lián)系,因此不具有語(yǔ)義,不能回答任何問(wèn)題。信息經(jīng)過(guò)加工和解釋,通過(guò)某種關(guān)聯(lián)而具有含義的數(shù)據(jù)。知識(shí)經(jīng)過(guò)挑選、改造形成的、可以用于決策的、系統(tǒng)化的信息。

知識(shí)工程:數(shù)據(jù)和信息→知識(shí)知識(shí)的類(lèi)型:陳述性、過(guò)程性陳述性知識(shí):描述客觀事物的性狀和關(guān)系等靜態(tài)信息,主要分為事物、概念、命題三個(gè)層次。事物:指特定的事或物。概念:指對(duì)一類(lèi)事物本質(zhì)特征的反映。命題:對(duì)事物之間關(guān)系的陳述。非概括性命題:表示特定事物之間關(guān)系概括性命題:描述概念之間的普遍關(guān)系過(guò)程性知識(shí):描述問(wèn)題如何求解等動(dòng)態(tài)信息。規(guī)則:描述事物的因果關(guān)系控制結(jié)構(gòu):描述問(wèn)題的求解步驟什么是知識(shí)庫(kù)在對(duì)各種知識(shí)進(jìn)行收集和整理的基礎(chǔ)上,進(jìn)行形式化表示,按照一定方法存儲(chǔ),并提供相應(yīng)的知識(shí)查詢手段,就形成知識(shí)庫(kù)。知識(shí)共享和應(yīng)用的基礎(chǔ)。知識(shí)圖譜是知識(shí)庫(kù)的一種形式。知識(shí)工程1977年,在第五屆國(guó)際人工智能會(huì)議上,美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)家費(fèi)根鮑姆教授(E.A.Feigenbaum)發(fā)表特約文章“人工智能的藝術(shù):知識(shí)工程課題及實(shí)例研究”,系統(tǒng)地闡述了“專家系統(tǒng)”的思想,并提出了“知識(shí)工程”的概念,確定了知識(shí)在人工智能中的重要地位。1984年,“ARTIFICIALINTELLIGENCE:THESECONDCOMPUTERAGE”10依賴專家構(gòu)建知識(shí),在受限領(lǐng)域的專家系統(tǒng)中取得成功Knowledgeispower,andthecomputerisanamplifierofthatpower.Wearenowatthedawnofanewcomputerrevolution...Knowledgeitselfistobecomethenewwealthofnations.大數(shù)據(jù)知識(shí)工程大數(shù)據(jù)時(shí)代,信息無(wú)法得到有效利用全球數(shù)據(jù)以每年58%的速度增長(zhǎng)包括互聯(lián)網(wǎng)大數(shù)據(jù),行業(yè)大數(shù)據(jù)(金融、醫(yī)療、司法、電商等等)大數(shù)據(jù)中,信息以多種形式存在圖片、聲音、文字、視頻結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化其中約80%是非結(jié)構(gòu)化數(shù)據(jù)23%的有用數(shù)據(jù),3%的數(shù)據(jù)具有標(biāo)注信息,0.5%的數(shù)據(jù)被利用 —IDC2012BigData11大數(shù)據(jù)知識(shí)工程大數(shù)據(jù)中蘊(yùn)含豐富的知識(shí),迫切需要對(duì)大數(shù)據(jù)進(jìn)行知識(shí)化,轉(zhuǎn)化為大知識(shí)。目的:讓計(jì)算機(jī)更加有效地管理和利用信息知識(shí)化:結(jié)構(gòu)化:挖掘非結(jié)構(gòu)化數(shù)據(jù)蘊(yùn)含的語(yǔ)義,轉(zhuǎn)換成結(jié)構(gòu)化形式關(guān)聯(lián)化:刻畫(huà)知識(shí)單元之間的多層次、多維度的關(guān)聯(lián)12大數(shù)據(jù)知識(shí)工程——大規(guī)模、開(kāi)放域、多維度、自學(xué)習(xí)知識(shí)圖譜:源起Google公司的知識(shí)圖譜項(xiàng)目,體現(xiàn)在:使用Google搜索引擎時(shí),出現(xiàn)于搜索結(jié)果右側(cè)的相關(guān)知識(shí)展示。Q:亞里士多德哪年結(jié)婚?A:公元前326年2016年底,Google知識(shí)圖譜中的知識(shí)數(shù)量已經(jīng)達(dá)到了600億條,包括1500個(gè)類(lèi)別的5.7億個(gè)實(shí)體,以及它們之間的3.5萬(wàn)種關(guān)系。知識(shí)圖譜:圖的結(jié)構(gòu)以結(jié)構(gòu)化三元組的形式存儲(chǔ)現(xiàn)實(shí)世界中的實(shí)體及其關(guān)系,表示為,三元組通常描述了一個(gè)特定領(lǐng)域中的事實(shí),由頭實(shí)體、尾實(shí)體和描述這兩個(gè)實(shí)體之間的關(guān)系組成。實(shí)體集合:關(guān)系集合:三元組的集合:關(guān)系有時(shí)也稱為屬性,尾實(shí)體被稱為屬性值。從圖結(jié)構(gòu)的角度看,實(shí)體是知識(shí)圖譜中的節(jié)點(diǎn),關(guān)系是連接兩個(gè)節(jié)點(diǎn)的有向邊。14知識(shí)圖譜示例WikiData知識(shí)結(jié)構(gòu)<physicist,subclassof,scientist><placeofbirth,valuetypeconstraint,geographicalobject><placeofbirth,subpropertyof,location>實(shí)例數(shù)據(jù)<MaxPlanck,instanceof,human><MaxPlanck,occupation,physicist><MaxPlanck,placeofbirth,Kiel>15知識(shí)圖譜:大數(shù)據(jù)知識(shí)工程的高效模型結(jié)構(gòu)化:圖是一種能有效表示數(shù)據(jù)之間結(jié)構(gòu)的表達(dá)形式,因此,知識(shí)圖譜可以很好地建模大數(shù)據(jù)中蘊(yùn)含的知識(shí)結(jié)構(gòu)。關(guān)聯(lián)化:可以通過(guò)圖中節(jié)點(diǎn)的關(guān)聯(lián)和邊的關(guān)聯(lián)把多個(gè)來(lái)源的知識(shí)圖譜自然地關(guān)聯(lián)起來(lái),從而實(shí)現(xiàn)知識(shí)融合。規(guī)范化:結(jié)構(gòu)化和關(guān)聯(lián)化都采用統(tǒng)一的知識(shí)描述框架——語(yǔ)義網(wǎng)框架,便于知識(shí)的分享與利用。知識(shí)圖譜:人工智能的重要基礎(chǔ)設(shè)施知識(shí)圖譜以豐富的語(yǔ)義表示能力和靈活的結(jié)構(gòu)構(gòu)建了在計(jì)算機(jī)世界中表示認(rèn)知世界和物理世界中信息和知識(shí)的有效載體。17提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)知識(shí)圖譜的發(fā)展歷程191950-1970時(shí)代符號(hào)邏輯神經(jīng)網(wǎng)絡(luò)LISP產(chǎn)生式規(guī)則、語(yǔ)義網(wǎng)絡(luò)1970-1990時(shí)代專家系統(tǒng)限定領(lǐng)域知識(shí)庫(kù)+推理=智能腳本、框架等1990-2000時(shí)代萬(wàn)維網(wǎng)人工大規(guī)模知識(shí)庫(kù)本體概念智能主體、機(jī)器人2006年時(shí)代維基結(jié)構(gòu)化通用和領(lǐng)域知識(shí)大規(guī)模知識(shí)獲取大規(guī)模工業(yè)應(yīng)用2000-2006時(shí)代

互聯(lián)網(wǎng)發(fā)展高峰

語(yǔ)義Web

群體智能:維基從信息服務(wù)向知識(shí)服務(wù)的躍遷是機(jī)器智能發(fā)展的必然知識(shí)圖譜與人工智能從1977年費(fèi)根鮑姆提出知識(shí)工程概念開(kāi)始,知識(shí)工程已經(jīng)成為人工智能的重要組成部分。研究界提出了一系列各具特點(diǎn)的知識(shí)表示理論和方法,并試圖基于這些理論和方法構(gòu)建知識(shí)庫(kù)上世紀(jì)70年代,以一階謂詞邏輯為代表的邏輯表示方法(Logic)1974年,閔斯基提出框架表示法(Frames)1978年,心理學(xué)家西爾文·湯姆金斯提出腳本理論(Scripttheory)1987年:奎利恩提出語(yǔ)義網(wǎng)絡(luò)(SemanticNetwork)上世紀(jì)九十年代開(kāi)始,以統(tǒng)計(jì)機(jī)器學(xué)習(xí)為核心的人工智能技術(shù)逐步占據(jù)主流,“如何自動(dòng)學(xué)習(xí)和利用知識(shí)進(jìn)行推斷和決策?”成為人工智能的研究熱點(diǎn)。知識(shí)圖譜與互聯(lián)網(wǎng):萬(wàn)維網(wǎng)互聯(lián)網(wǎng)的發(fā)展階段:WorldWideWeb(Web1.0)、SocialWeb(Web2.0)SemanticWeb(Web3.0)、WebScience萬(wàn)維網(wǎng):采用超文本標(biāo)記語(yǔ)言HTML,Web內(nèi)容沒(méi)有采用形式化表示方式,缺乏明確的語(yǔ)義信息,是面向人的存儲(chǔ)和共享信息的媒介,計(jì)算機(jī)信息查詢和利用很困難。語(yǔ)義網(wǎng):是萬(wàn)維網(wǎng)的拓展和變革。它基于知識(shí)本體,對(duì)Web數(shù)據(jù)的內(nèi)容進(jìn)行了規(guī)范化的語(yǔ)義標(biāo)注和關(guān)聯(lián),從而可以支持高效的機(jī)器信息共享和智能應(yīng)用。語(yǔ)義網(wǎng)剛推出的十年間,并沒(méi)有在實(shí)際中大規(guī)模應(yīng)用,但其成果大力推動(dòng)了使用本體模型和形式化手段表達(dá)數(shù)據(jù)語(yǔ)義的方法的研究,為后續(xù)的知識(shí)圖譜熱潮奠定了基礎(chǔ)。知識(shí)圖譜的發(fā)展歷程人工智能:知識(shí)的數(shù)據(jù)化——讓計(jì)算機(jī)表示、組織和存儲(chǔ)人類(lèi)的知識(shí)人工智能的研究目標(biāo)是使計(jì)算機(jī)更智能,讓計(jì)算機(jī)能夠完成一些人腦才能完成的任務(wù),例如推理、分析、預(yù)測(cè)、思考等高級(jí)思維活動(dòng)。人們希望借助知識(shí)庫(kù)完成該目標(biāo),即把人類(lèi)的知識(shí)用計(jì)算機(jī)進(jìn)行表示和組織,并設(shè)計(jì)相應(yīng)算法完成推理、預(yù)測(cè)等任務(wù)。語(yǔ)義網(wǎng):數(shù)據(jù)的知識(shí)化——讓數(shù)據(jù)支持推理等智能任務(wù)隨著互聯(lián)網(wǎng)的發(fā)展,雖然存儲(chǔ)和檢索海量數(shù)據(jù)的能力日益提高,但是沒(méi)有推理、預(yù)測(cè)等完成復(fù)雜任務(wù)的功能,不能有效支持行業(yè)智能等決策任務(wù)。人們希望通過(guò)引入知識(shí),使得原始數(shù)據(jù)能夠支撐推理、問(wèn)題求解等復(fù)雜任務(wù)(如多維數(shù)據(jù)分析),這個(gè)目標(biāo)就是語(yǔ)義網(wǎng)。22知識(shí)圖譜的發(fā)展歷程經(jīng)典知識(shí)表示理論一階謂詞邏輯語(yǔ)義網(wǎng)絡(luò)框架腳本語(yǔ)義網(wǎng)資源描述框架XMLRDFRDFSchemaOWL知識(shí)圖譜基于“語(yǔ)義網(wǎng)絡(luò)(SemanticNetwork)”理論,依據(jù)語(yǔ)義網(wǎng)(SemanticWeb)的技術(shù)框架和工程規(guī)范,對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行知識(shí)化的一個(gè)知識(shí)工程產(chǎn)品。知識(shí)圖譜發(fā)展的推動(dòng)力以維基百科為核心的協(xié)同知識(shí)資源對(duì)于知識(shí)圖譜的發(fā)展起到了決定性的作用。兩個(gè)大規(guī)模通用領(lǐng)域知識(shí)圖譜Freebase和DBpedia都是以Wikipedia的Infobox數(shù)據(jù)為基礎(chǔ)構(gòu)建而成的。Freebase更偏向于知識(shí)工程的技術(shù)路線:自頂向下DBpedia更偏向于語(yǔ)義網(wǎng)的技術(shù)路線:自底向上真實(shí)應(yīng)用需求是知識(shí)圖譜發(fā)展的另一主要推動(dòng)力。具有語(yǔ)義分析能力的信息搜索引擎能夠理解人類(lèi)的自然語(yǔ)言,并且具有一定的推理和判斷能力,從而提供符合用戶需求的信息服務(wù)。24知識(shí)圖譜的發(fā)展歷程提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)詞語(yǔ)、實(shí)體、關(guān)系、屬性實(shí)體:entity,客觀存在并可相互區(qū)別的事物,可以是具體的人、事、物,也可以是抽象的概念。關(guān)系:relation,不同的實(shí)體之間各種聯(lián)系。TaxonomicRelationis-aHypernym-HyponymNon-taxonomicRelationMeoronymy部分整體Thematicroles論旨角色Attribute

屬性Possession領(lǐng)屬Casuality因果,等等詞語(yǔ):wordandphrases,用于描述實(shí)體、關(guān)系這些認(rèn)知單元的語(yǔ)言單位。實(shí)體和關(guān)系是有確切含義的;詞語(yǔ)是有歧義的,在不同的語(yǔ)境中指稱不同的實(shí)體或關(guān)系。Ontology

vs.KnowledgeBasevs.DatabaseOntology:本體,一套對(duì)客觀世界進(jìn)行描述的共享概念化體系。它對(duì)特定領(lǐng)域中概念(事物的類(lèi)型)及其相互關(guān)系進(jìn)行形式化表達(dá),重點(diǎn)是對(duì)數(shù)據(jù)的定義進(jìn)行描述,而不是描述具體事物的實(shí)例數(shù)據(jù)。涉及概念、關(guān)系和公理三個(gè)要素KnowledgeBase:知識(shí)庫(kù),服從于ontology控制的知識(shí)實(shí)例及其載體。Database:數(shù)據(jù)庫(kù),計(jì)算機(jī)科學(xué)家為了用電腦表示和存儲(chǔ)計(jì)算機(jī)應(yīng)用中所需要的數(shù)據(jù)所設(shè)計(jì)開(kāi)發(fā)的產(chǎn)品。FormalOntology

vs.LightweightOntologyFormalOntology:大量使用公理LightweightOntology:不用或很少使用公理Ontology

vs.Taxonomyvs.FolksonomyTaxonomy:分類(lèi)法,或稱分類(lèi)體系,是由專家編制的專業(yè)層次類(lèi)別體系,如中圖分類(lèi)體系等。也有一些不嚴(yán)格的分類(lèi)體系,通常由一些組織為了自身需要而編制,如Yahoo分類(lèi)目錄等。Ontology:本體,共享概念的規(guī)范。Ontology通常涵蓋概念之間的分類(lèi)體系,但是除此之外,更重要的是它還有概念之間的相關(guān)關(guān)系,如反向、傳遞、對(duì)稱等,以及在此基礎(chǔ)上建立的推理規(guī)則,從而支持復(fù)雜推理。由于具有嚴(yán)格的規(guī)范,一般用戶難以構(gòu)建。Folksonomy:社會(huì)分類(lèi)法,是由用戶的自由標(biāo)簽自動(dòng)形成的一種分類(lèi)法,在對(duì)同一事物進(jìn)行標(biāo)簽的所有標(biāo)簽中,取出高頻標(biāo)簽作為分類(lèi)標(biāo)簽。嚴(yán)格講,是一種標(biāo)簽方法,并不一定構(gòu)成一個(gè)分類(lèi)體系。另一方面,標(biāo)簽具有隨意性(歧義性)。語(yǔ)言知識(shí):語(yǔ)言層面上的知識(shí),例如:Microsoft的縮寫(xiě)是MS;喬丹和佐敦具有同指關(guān)系;減肥和瘦身是同義詞等。百科知識(shí):涵蓋各個(gè)行業(yè)、領(lǐng)域的通用知識(shí),例如:人物、機(jī)構(gòu)、地點(diǎn)等。領(lǐng)域知識(shí):某個(gè)領(lǐng)域內(nèi)特有的專業(yè)知識(shí),例如:法律知識(shí)、金融知識(shí)等。場(chǎng)景知識(shí):某個(gè)特定場(chǎng)景下或者需要完成某項(xiàng)任務(wù)時(shí)所需要的知識(shí),例如:在訂機(jī)票過(guò)程中需要提供的信息;蓋房子的步驟等。常識(shí)知識(shí):那些大家都認(rèn)可的知識(shí),例如:狗有四條腿、鳥(niǎo)會(huì)飛等。知識(shí)的類(lèi)型知識(shí)圖譜的類(lèi)型:知識(shí)類(lèi)型語(yǔ)言知識(shí)圖譜:WordNet常識(shí)知識(shí)圖譜:Cyc、ConceptNet、HowNet百科知識(shí)圖譜:DBpedia、Freebase、GoogleKG、Wikidata語(yǔ)言+百科知識(shí)圖譜:YAGO、BabelNet領(lǐng)域知識(shí)圖譜:醫(yī)學(xué)知識(shí)圖譜SIDER(SideEffectResource)電影知識(shí)圖譜IMDB(InternetMovieDatabase)音樂(lè)知識(shí)圖譜MusicBrainz代表性的知識(shí)圖譜CycDouglasLenat于1984年創(chuàng)建,最初的目標(biāo)是依靠專家將上百萬(wàn)條人類(lèi)常識(shí)編碼為機(jī)器可處理的形式,建立最大的常識(shí)知識(shí)庫(kù),從而支持復(fù)雜的機(jī)器推理任務(wù)。例如:“每棵樹(shù)都是植物”、“植物最終都會(huì)死亡”。當(dāng)提出“樹(shù)是否會(huì)死亡”的問(wèn)題時(shí),推理引擎可以得到正確的結(jié)論,并回答該問(wèn)題。采取CycL語(yǔ)言來(lái)進(jìn)行描述,該語(yǔ)言基于謂詞邏輯,語(yǔ)法上與Lisp程序設(shè)計(jì)語(yǔ)言類(lèi)似。主要由術(shù)語(yǔ)Terms和斷言Assertions組成。Terms:包含實(shí)體、概念和關(guān)系的定義。Assertions:用來(lái)建立Terms之間的關(guān)系,不僅包含大量事實(shí)Facts,還包含用于推理的常識(shí)規(guī)則Rules。在此基礎(chǔ)上提供多種推理引擎,支持演繹推理和歸納推理,同時(shí)也提供擴(kuò)展推理機(jī)制的模塊。Cyc:局限性基于形式化的一階謂詞邏輯表示方法刻畫(huà)知識(shí),優(yōu)勢(shì)是可以支持復(fù)雜的邏輯推理。但是過(guò)分嚴(yán)格的形式化也導(dǎo)致知識(shí)庫(kù)的擴(kuò)展性和應(yīng)用的靈活性不夠。由專家構(gòu)建,雖然準(zhǔn)確,但是費(fèi)時(shí)費(fèi)力,規(guī)模和范圍遠(yuǎn)遠(yuǎn)不夠。因此,近年來(lái)Cyc也開(kāi)始使用一些自動(dòng)構(gòu)建的方法從非結(jié)構(gòu)化文本中自動(dòng)抽取知識(shí)。從2008年開(kāi)始,Cyc開(kāi)始將其資源與Wikipedia、DBpedia等資源進(jìn)行關(guān)聯(lián),建立它們之間的鏈接。WordNet1985年,Princeton大學(xué)建立的英文詞匯語(yǔ)義知識(shí)庫(kù)。理論基礎(chǔ):德國(guó)學(xué)者特雷爾的現(xiàn)代語(yǔ)義學(xué)理論——語(yǔ)義場(chǎng)理論。語(yǔ)言中的詞匯在語(yǔ)義上是相互聯(lián)系的,共同構(gòu)成一個(gè)完整的詞匯系統(tǒng)。通過(guò)分析、比較詞與詞之間的語(yǔ)義關(guān)系,才能確定其真實(shí)含義。語(yǔ)義場(chǎng)根據(jù)詞語(yǔ)關(guān)系的不同,可以歸為四類(lèi):上下義義場(chǎng)、整體與部分義場(chǎng)、同義義場(chǎng)、反義義場(chǎng)WordNet采用人工標(biāo)注方法,將英文單詞按照其語(yǔ)義組成一個(gè)大的概念網(wǎng)絡(luò)。詞語(yǔ)被聚類(lèi)成同義詞集(Synset),每個(gè)同義詞集表示一個(gè)基本的詞匯語(yǔ)義概念。詞集之間的語(yǔ)義關(guān)系包括同義關(guān)系、反義關(guān)系、上位關(guān)系、下位關(guān)系、整體關(guān)系、部分關(guān)系、蘊(yùn)含關(guān)系、因果關(guān)系、近似關(guān)系等。1991年,WordNet1.0版本正式公布,目前WordNet包含146,350個(gè)單詞,111,223個(gè)同義詞集。FrameNet語(yǔ)義框架庫(kù)1997年開(kāi)始,由Berkeley構(gòu)建的詞匯語(yǔ)義知識(shí)庫(kù)。理論基礎(chǔ):美國(guó)語(yǔ)言學(xué)家Fillmore的框架語(yǔ)義學(xué)理論Frame

SemanticsHypothesis:Peopleunderstandthingsbyperformingmentaloperationsonwhattheyalreadyknow.Suchknowledgeisdescribableintermsofinformationpacketscalledframes.認(rèn)為大部分詞匯的語(yǔ)義能夠通過(guò)語(yǔ)義框架的形式進(jìn)行表示。FrameNet語(yǔ)義框架:對(duì)詞語(yǔ)蘊(yùn)含概念的知識(shí)預(yù)設(shè),是人類(lèi)長(zhǎng)期實(shí)踐中形成并用于組織和解釋經(jīng)驗(yàn)的知識(shí)架構(gòu)和概念工具?!芭腼儭边@一概念的框架通常包括:烹飪的發(fā)起者(廚師)、烹飪的對(duì)象(食物)、烹飪的工具(容器)和加熱的來(lái)源(加熱設(shè)備)等等??蚣苊Q:烹飪框架元素:廚師、食物、容器和加熱設(shè)備詞語(yǔ)單元:最能指示該框架發(fā)生的詞,例如烘焙、油炸、蒸煮等。FrameNetFrame具有層級(jí)的組織結(jié)構(gòu),位于最上層的節(jié)點(diǎn)表示框架,框架之間的邊表示框架間的關(guān)系??蚣荛g的關(guān)系繼承、視角、子框架、前置、始動(dòng)、因果、使用、參考等八種FrameNet規(guī)模1000+框架10000+詞法單元150000+標(biāo)注例句知網(wǎng):HowNet知網(wǎng)是對(duì)概念與概念之間的關(guān)系以及概念的屬性與屬性之間的關(guān)系進(jìn)行描述而形成的一個(gè)網(wǎng)狀的知識(shí)系統(tǒng)。區(qū)別于Wordnet,HowNet并不是將所有概念歸結(jié)到一個(gè)樹(shù)狀的概念層次體系中,而是試圖用一系列的義原對(duì)每一個(gè)概念進(jìn)行描述,義原之間通過(guò)義原關(guān)系進(jìn)行關(guān)聯(lián),從而使得HowNet是一個(gè)網(wǎng)狀的知識(shí)系統(tǒng)。概念:對(duì)詞匯語(yǔ)義的一種描述。一個(gè)詞可以表達(dá)多個(gè)概念,一個(gè)概念也可以用多個(gè)詞表示。在知網(wǎng)中,概念是用一種“知識(shí)表示語(yǔ)言”來(lái)描述的,這種“知識(shí)表示語(yǔ)言”所用的詞匯叫做義原。義原是用于描述一個(gè)概念的最小意義單位。知網(wǎng):義原體系知網(wǎng)總共有1500多個(gè)義原,分為以下大類(lèi):Event|事件entity|實(shí)體attribute|屬性值aValue|屬性值quantity|數(shù)量qValue|數(shù)量值SecondaryFeature|次要特征syntax|語(yǔ)法EventRole|動(dòng)態(tài)角色EventFeatures|動(dòng)態(tài)屬性基本義原:描述概念的語(yǔ)義特征語(yǔ)法義原:描述概念的語(yǔ)法特征關(guān)系義原:描述概念之間的格關(guān)系。知網(wǎng):義原關(guān)系義原之間的關(guān)系:上下位關(guān)系同義關(guān)系反義關(guān)系對(duì)義關(guān)系屬性-宿主關(guān)系部件-整體關(guān)系材料-成品關(guān)系事件-角色關(guān)系義原之間通過(guò)這些關(guān)系組成一個(gè)復(fù)雜的網(wǎng)狀結(jié)構(gòu)。ConceptNet是由描述概念及其關(guān)系的常識(shí)構(gòu)成的一個(gè)開(kāi)放的、多語(yǔ)言的常識(shí)知識(shí)圖譜。ConceptNetisaknowledgegraphthatconnectswordsandphrasesofnaturallanguage(terms)withlabeled,weightededges(assertions).最早起源于MITMediaLab的一個(gè)知識(shí)工程項(xiàng)目:OpenMindCommonSense(OMCS),該項(xiàng)目由人工智能之父、框架理論的創(chuàng)立者M(jìn)arvinMinsky于1999年建議創(chuàng)立,致力于幫助計(jì)算機(jī)理解人們?nèi)粘J褂玫膯卧~的意義。ConceptNet5包含8百萬(wàn)節(jié)點(diǎn),2100萬(wàn)關(guān)系描述。主要通過(guò)專家構(gòu)建、互聯(lián)網(wǎng)眾包和游戲三種方式構(gòu)建。新版本導(dǎo)入了大量開(kāi)放的結(jié)構(gòu)化數(shù)據(jù):DBPedia,Wikinary,Cyc,WordNet等。與Cyc是一個(gè)基于謂詞邏輯的常識(shí)本體相比,ConceptNet采用詞語(yǔ)關(guān)系三元組描述,形式較為簡(jiǎn)單。與DBPedia和GoogleKnowledgeGraph重點(diǎn)描述實(shí)體關(guān)系相比,ConceptNet側(cè)重于自然語(yǔ)言中普通詞的常識(shí)意義(Common-sensemeaning)。更加接近于WordNet,但是包含的關(guān)系類(lèi)型更多。ConceptNet的關(guān)系是專門(mén)制定的語(yǔ)義類(lèi)別,具有確切含義。36個(gè)核心關(guān)系類(lèi)別SymmetricrelationsAntonym,DistinctFrom,EtymologicallyRelatedTo,LocatedNear,RelatedTo,SimilarTo,andSynonymAsymmetricrelationsAtLocation,CapableOf,Causes,CausesDesire,CreatedBy,De?nedAs,DerivedFrom,Desires,Entails,ExternalURL,FormOf,HasA,HasContext,HasFirstSubevent,HasLastSubevent,HasPrerequisite,HasProperty,InstanceOf,IsA,MadeOf,MannerOf,MotivatedByGoal,ObstructedBy,PartOf,ReceivesAction,SenseOf,SymbolOf,andUsedForDBpedia2007年開(kāi)始,其主要目標(biāo)是構(gòu)建一個(gè)社區(qū),通過(guò)社區(qū)成員來(lái)定義和撰寫(xiě)準(zhǔn)確的抽取模板,從維基百科中抽取結(jié)構(gòu)信息,并將其發(fā)布到Web上。DBPedia總共包含95億事實(shí)三元組13億數(shù)據(jù)抽取自英文版維基百科50億數(shù)據(jù)抽取自其他語(yǔ)言的維基百科32億抽取自Wikidata數(shù)據(jù)DBpedia的抽取方法社區(qū)通過(guò)人工的方式構(gòu)建了Ontology280個(gè)類(lèi)別覆蓋約50%的維基百科實(shí)體DIEF-DBpediaInformationExtractionFramework目標(biāo):抽取Wikipedia中的結(jié)構(gòu)化信息方法:基于屬性mapping的Infobox抽取,RawInfoboxExtraction,FeatureExtraction,StatisticalExtraction編程語(yǔ)言:Scala&JavaDBPediaLive:持續(xù)保持與Wikipedia的同步2013年六月,英語(yǔ)維基百科有將近330萬(wàn)次編輯(每分鐘越77次)YAGO德國(guó)馬普研究所從2007年開(kāi)始的一個(gè)項(xiàng)目YAGO基于WordNet的知識(shí)體系,將Wikipedia中的類(lèi)別與WordNet中的類(lèi)別進(jìn)行關(guān)聯(lián),同時(shí)將Wikipedia中的條目掛載到WordNet的體系下。通過(guò)語(yǔ)言本體和世界知識(shí)的融合,一方面擴(kuò)充了語(yǔ)言知識(shí)庫(kù),另一方面對(duì)海量的世界知識(shí)進(jìn)行了組織和整理。YAGO

Ontology構(gòu)建YAGO使用RDFs(RDFSchema)語(yǔ)言與OWL(OntologyWebLanguage)語(yǔ)言描述,構(gòu)成一個(gè)具有清晰完整邏輯定義的知識(shí)系統(tǒng)。YAGO2在2017年人工智能?chē)?guó)際頂級(jí)學(xué)術(shù)會(huì)議IJCAI2017上獲得由ArtificialIntelligenceJournal(AIJ)頒發(fā)的卓越論文獎(jiǎng)(ProminentPaperAward)。BabelNet多語(yǔ)言詞匯語(yǔ)義網(wǎng)絡(luò)和本體,由羅馬薩皮恩扎大學(xué)創(chuàng)建。與YAGO類(lèi)似,BabelNet也是將維基百科鏈接到WordNet上。但是BabelNet加入了多語(yǔ)言支持,目前覆蓋了271種語(yǔ)言,包栝全部的歐洲語(yǔ)言、大多數(shù)亞洲語(yǔ)言及拉丁語(yǔ)。包含大約1400萬(wàn)個(gè)同義詞集和7.46億個(gè)詞義。BabelNet同YAGO一起,在IJCAI2017上獲得卓越論文獎(jiǎng)。Freebase從Wikipedia和其他數(shù)據(jù)源(如IMDB、MusicBrainz)中導(dǎo)入知識(shí)核心想法:在Wikipedia中,人們編輯文章在Freebase中,人們編輯結(jié)構(gòu)化知識(shí)FreebaseMetaweb公司2000年開(kāi)始構(gòu)建基于維基百科、使用群體智能方法建立的完全結(jié)構(gòu)化的知識(shí)資源。是公開(kāi)可獲取的規(guī)模最大的知識(shí)圖譜之一。包含4726萬(wàn)實(shí)體、19億個(gè)實(shí)體關(guān)系三元組2010年被谷歌收購(gòu)并納入到谷歌知識(shí)圖譜中。2015年,谷歌關(guān)閉了Freebase,并把數(shù)據(jù)全部遷移到Wikidata。Google:KnowledgeVault2014年創(chuàng)建的一個(gè)大規(guī)模知識(shí)圖譜。相較于Google之前基于Freebase的知識(shí)圖譜版本,KnowledgeVault不再采用眾包方式進(jìn)行圖譜構(gòu)建,而是通過(guò)機(jī)器學(xué)習(xí)方法自動(dòng)搜集網(wǎng)上信息,并與已有的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行融合,構(gòu)建知識(shí)圖譜。集成和融合YAGO、Freebase、網(wǎng)頁(yè)中的表格數(shù)據(jù)等目前,KnowledgeVault已經(jīng)收集了16億個(gè)事實(shí)2.71億事實(shí)具有高置信度,準(zhǔn)確率在90%左右。KnowItAll華盛頓大學(xué)圖靈中心的開(kāi)放信息抽取項(xiàng)目目標(biāo):讓機(jī)器自動(dòng)閱讀互聯(lián)網(wǎng)文本內(nèi)容,從大量非結(jié)構(gòu)化文本中抽取結(jié)構(gòu)化的實(shí)體關(guān)系三元組信息。區(qū)別于傳統(tǒng)的文本信息抽取系統(tǒng),這里要抽取的關(guān)系(Predicate)不是預(yù)定義的,是開(kāi)放性的;但是頭實(shí)體Subject和尾實(shí)體Object是確定性的(利用Freebase的實(shí)體消歧工具進(jìn)行消歧)。KnowItAll:TextRunner

&ReVerbTextRunner和Reverb系統(tǒng)是KnowItAll項(xiàng)目中的兩個(gè)代表系統(tǒng)。主要功能:從文本中通過(guò)識(shí)別句子的謂詞抽取所有的二元關(guān)系利用網(wǎng)絡(luò)數(shù)據(jù)的冗余信息,對(duì)初步認(rèn)定可信的信息進(jìn)行評(píng)估??梢栽谙到y(tǒng)中直接查詢知識(shí)(實(shí)體關(guān)系三元組)NELL卡內(nèi)基梅隆大學(xué)基于ReadtheWeb項(xiàng)目開(kāi)發(fā)的一套“永不停歇的語(yǔ)言學(xué)習(xí)”系統(tǒng)。

Never-EndingLanguageLearning系統(tǒng)每天不間斷地執(zhí)行兩項(xiàng)任務(wù):閱讀和學(xué)習(xí)閱讀任務(wù)從Web文本中獲取三元組知識(shí),并添加到內(nèi)部知識(shí)庫(kù)學(xué)習(xí)任務(wù)目標(biāo)是提升機(jī)器學(xué)習(xí)算法的性能區(qū)別于KnowItAll,NELL抽取的實(shí)體類(lèi)別和關(guān)系類(lèi)別都是確定的。實(shí)體:300多類(lèi);關(guān)系:900多類(lèi)目前規(guī)模:三元組5000萬(wàn),高質(zhì)量的280萬(wàn)抽取結(jié)果示例領(lǐng)域知識(shí)圖譜影視領(lǐng)域知識(shí)圖譜IMDBInternetMovieDatabase關(guān)于電影、電視節(jié)目、演員和電影制作的知識(shí)圖譜截止到2012年2月,IMDB共收錄了2,132,383部作品資料以及4,530,159名人物資料。音樂(lè)領(lǐng)域知識(shí)圖譜MusicBrainZ致力于收藏音樂(lè)數(shù)據(jù),有許多著名的音樂(lè)服務(wù)網(wǎng)站的數(shù)據(jù)均來(lái)自MusicBrainZ用戶注冊(cè)后即可以使用并且向其中增加數(shù)據(jù)醫(yī)療衛(wèi)生領(lǐng)域知識(shí)圖譜SIDERSideEffectResource主要包含了已經(jīng)上市的藥物及其記錄在冊(cè)的副作用,這些數(shù)據(jù)可以為相關(guān)疾病的治療提供依據(jù)。LinkedOpenData(LOD)國(guó)際萬(wàn)維網(wǎng)組織W3C于2007年發(fā)起的開(kāi)放互聯(lián)數(shù)據(jù)項(xiàng)目目的是將由互聯(lián)文檔組成的網(wǎng)絡(luò)(WebofDocuments)擴(kuò)展成為由互聯(lián)數(shù)據(jù)組成的全球數(shù)據(jù)及知識(shí)共享平臺(tái)(WebofData)LOD的目標(biāo)是:以RDF語(yǔ)義形式在Web上發(fā)布各種開(kāi)放數(shù)據(jù)集,并在不同來(lái)源的數(shù)據(jù)項(xiàng)之間建立語(yǔ)義鏈接,從而增強(qiáng)Web上的數(shù)據(jù)共享,最終實(shí)現(xiàn)語(yǔ)義Web知識(shí)資源的開(kāi)放共享。LOD項(xiàng)目發(fā)布了570余個(gè)數(shù)據(jù)集,包含上千億RDF三元組,并且隨著鏈接數(shù)據(jù)的推廣和LOD項(xiàng)目的發(fā)展,將有越來(lái)越多的數(shù)據(jù)以鏈接數(shù)據(jù)的形式發(fā)布在萬(wàn)維網(wǎng)上。LOD為實(shí)現(xiàn)網(wǎng)絡(luò)環(huán)境下的知識(shí)發(fā)布、互聯(lián)、共享和服務(wù)提供了創(chuàng)新技術(shù),為智能搜索、知識(shí)問(wèn)答和語(yǔ)義集成提供了創(chuàng)新源動(dòng)力。提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)知識(shí)圖譜的生命周期知識(shí)本體構(gòu)建也叫知識(shí)建模建模領(lǐng)域知識(shí)結(jié)構(gòu)知識(shí)獲取和驗(yàn)證獲取領(lǐng)域內(nèi)的事實(shí)知識(shí)估計(jì)知識(shí)的可信度知識(shí)融合也叫知識(shí)集成將碎片知識(shí)組裝成知識(shí)網(wǎng)絡(luò)知識(shí)存儲(chǔ)和查詢采用何種方式對(duì)知識(shí)圖譜進(jìn)行存儲(chǔ)采用何種方式對(duì)知識(shí)圖譜進(jìn)行查詢知識(shí)推理發(fā)現(xiàn)已有知識(shí)中隱含的知識(shí)知識(shí)應(yīng)用提供高性能知識(shí)服務(wù)知識(shí)本體構(gòu)建知識(shí)建模指采用什么樣的方式表達(dá)知識(shí),其核心是構(gòu)建一個(gè)本體對(duì)目標(biāo)知識(shí)進(jìn)行描述。該本體需要:定義出知識(shí)的類(lèi)別體系每個(gè)類(lèi)別下所屬的實(shí)體和概念某類(lèi)概念和實(shí)體所具有的屬性以及概念之間、實(shí)體之間的語(yǔ)義關(guān)系定義在這個(gè)本體上的一些推理規(guī)則Freebase的知識(shí)體系定義了超過(guò)1.5萬(wàn)個(gè)概念類(lèi)別和4,000個(gè)屬性對(duì)每個(gè)類(lèi)別定義了若干關(guān)系,并制定關(guān)系的值域約束其取值。知識(shí)本體構(gòu)建輸入:領(lǐng)域(醫(yī)療、金融...)應(yīng)用場(chǎng)景輸出:領(lǐng)域知識(shí)本體領(lǐng)域?qū)嶓w類(lèi)別體系實(shí)體類(lèi)別的屬性類(lèi)別之間的語(yǔ)義關(guān)系語(yǔ)義關(guān)系之間的關(guān)系關(guān)鍵技術(shù):Ontology

Engineering知識(shí)本體構(gòu)建作為語(yǔ)義網(wǎng)的應(yīng)用,知識(shí)圖譜的知識(shí)建模采用語(yǔ)義網(wǎng)的知識(shí)建模方式,分為概念、關(guān)系、概念關(guān)系三元組三個(gè)層次,并利用“資源描述框架(RDF)”進(jìn)行描述。RDF的基本數(shù)據(jù)模型包括了三個(gè)對(duì)象類(lèi)型:資源(Resource)能夠使用RDF表示的對(duì)象稱之為資源,包括互聯(lián)網(wǎng)上的實(shí)體、事件和概念等。謂詞(Predicate)主要描述資源本身的特征和資源之間的關(guān)系。每一個(gè)謂詞可以定義元知識(shí),例如,謂詞的頭尾部數(shù)據(jù)值的類(lèi)型(如定義域和值域)、謂詞與其他謂詞的關(guān)系(如逆關(guān)系)。陳述(Statements)一條陳述包含三個(gè)部分,通常稱之為RDF三元組<主體(subject),謂詞(predicate),賓語(yǔ)(object)>。其中主體是被描述的資源,謂詞可以表示主體的屬性,也可以表示主體和賓語(yǔ)之間關(guān)系。當(dāng)表示屬性時(shí),賓語(yǔ)就是屬性值;當(dāng)表示關(guān)系時(shí),賓語(yǔ)也是一個(gè)資源。知識(shí)獲取輸入:領(lǐng)域知識(shí)本體海量數(shù)據(jù):文本、垂直站點(diǎn)、百科輸出:實(shí)例知識(shí)實(shí)體集合實(shí)體關(guān)系/屬性主要技術(shù):信息抽取文本挖掘知識(shí)獲取682011年4月11日17點(diǎn)16分,日本東北部的福島和茨城地區(qū)發(fā)生里氏7.0級(jí)強(qiáng)烈地震(震中北緯36.9度、東經(jīng)140.7度,即福島西南30公里左右的地方,震源深度10公里,屬于淺層地震)當(dāng)局已經(jīng)發(fā)布海嘯預(yù)警震后約30分鐘后在日本海地區(qū)發(fā)生巨型海嘯,同時(shí)造成福島核電站出現(xiàn)核泄漏震后第十天,國(guó)際原子能機(jī)構(gòu)對(duì)于日本政府反應(yīng)遲鈍進(jìn)行了譴責(zé)知識(shí)融合輸入:抽取出來(lái)的知識(shí)知識(shí)本體現(xiàn)有知識(shí)庫(kù)輸出:統(tǒng)一知識(shí)庫(kù)知識(shí)置信度關(guān)鍵技術(shù):Ontology

MatchingEntity

Linking知識(shí)融合任務(wù):對(duì)不同來(lái)源、不同語(yǔ)言或不同結(jié)構(gòu)的知識(shí)進(jìn)行融合,從而對(duì)于已有知識(shí)圖譜進(jìn)行補(bǔ)充、更新和去重。YAGO:對(duì)專家構(gòu)建的高質(zhì)量語(yǔ)言知識(shí)圖譜WordNet和網(wǎng)民協(xié)同構(gòu)建的大規(guī)模實(shí)體知識(shí)圖譜Wikipedia進(jìn)行融合而形成的,實(shí)現(xiàn)質(zhì)量和數(shù)量的互補(bǔ);BabelNet:融合不同語(yǔ)言的知識(shí)圖譜,實(shí)現(xiàn)跨語(yǔ)言的知識(shí)關(guān)聯(lián)和共享。知識(shí)融合從融合的對(duì)象看,可以分為知識(shí)本體融合和知識(shí)實(shí)例融合。知識(shí)本體融合:兩個(gè)或多個(gè)異構(gòu)知識(shí)體系進(jìn)行融合,即對(duì)相同的類(lèi)別、屬性、關(guān)系進(jìn)行映射。知識(shí)實(shí)例融合:對(duì)于兩個(gè)不同知識(shí)圖譜中的實(shí)例(實(shí)體實(shí)例、關(guān)系實(shí)例)進(jìn)行融合,包括不同知識(shí)本體下的實(shí)例、不同語(yǔ)言的實(shí)例等從融合的知識(shí)圖譜類(lèi)型看,可以分為:豎直方向的融合和水平方向的融合。豎直方向的融合:融合(較)高層通用本體與(較)底層領(lǐng)域本體或?qū)嵗龜?shù)據(jù),融合Wordnet和Wikipedia水平方向的融合:融合同層次的知識(shí)圖譜,實(shí)現(xiàn)實(shí)例數(shù)據(jù)的互補(bǔ)。融合Freebase和DBpedia知識(shí)存儲(chǔ)和查詢輸入:大規(guī)模知識(shí)圖譜輸出:知識(shí)庫(kù)存儲(chǔ)結(jié)構(gòu)查詢服務(wù)主要技術(shù):知識(shí)表示知識(shí)查詢語(yǔ)言存儲(chǔ)/檢索引擎知識(shí)推理任務(wù):采用推理的手段發(fā)現(xiàn)已有知識(shí)中隱含的知識(shí)輸入:大規(guī)模知識(shí)圖譜輸出:隱含知識(shí)主要技術(shù):基于邏輯規(guī)則的推理基于表示學(xué)習(xí)的推理73知識(shí)推理:不同計(jì)算手段符號(hào)推理:特點(diǎn)是在知識(shí)圖譜中的實(shí)體和關(guān)系符號(hào)上直接進(jìn)行推理。數(shù)值推理:使用數(shù)值計(jì)算,尤其是向量矩陣計(jì)算的方法,捕捉知識(shí)圖譜上隱式的關(guān)聯(lián),模擬推理的進(jìn)行。知識(shí)應(yīng)用75語(yǔ)義搜索76語(yǔ)義搜索:天眼查關(guān)系搜索問(wèn)答79問(wèn)答:有推理能力推薦領(lǐng)域知識(shí)圖譜的應(yīng)用提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)符號(hào)表示和數(shù)值表示84符號(hào)表示知識(shí)表示:人工抽象的符號(hào)邏輯知識(shí)推理:符號(hào)演算優(yōu)點(diǎn):顯式語(yǔ)義,解釋性好缺點(diǎn):人工建立,覆蓋度不夠,難以應(yīng)對(duì)大規(guī)模開(kāi)放域計(jì)算需求知識(shí)圖譜數(shù)值表示數(shù)據(jù)表示:基于原始文本,在數(shù)值空間中表示語(yǔ)言符號(hào)語(yǔ)義計(jì)算:數(shù)值計(jì)算優(yōu)點(diǎn):可計(jì)算、自學(xué)習(xí)缺點(diǎn):依賴標(biāo)注數(shù)據(jù)、語(yǔ)義不明確、難于利用已有知識(shí)深度學(xué)習(xí)大數(shù)據(jù)環(huán)境下知識(shí)計(jì)算的方法論85提綱什么是知識(shí)圖譜知識(shí)圖譜發(fā)展歷程知識(shí)圖譜的類(lèi)型知識(shí)圖譜的生命周期知識(shí)圖譜和深度學(xué)習(xí)總結(jié)知識(shí)圖譜的特點(diǎn)知識(shí)圖譜是人工智能應(yīng)用不可或缺的基礎(chǔ)資源在語(yǔ)義搜索、問(wèn)答系統(tǒng)、智能客服、個(gè)性化推薦等互聯(lián)網(wǎng)應(yīng)用中占有核心地位,在金融智能、商業(yè)智能、智慧醫(yī)療、智慧司法等領(lǐng)域具有廣闊的應(yīng)用前景。語(yǔ)義表達(dá)能力豐富,能夠勝任當(dāng)前知識(shí)服務(wù)知識(shí)圖譜源于語(yǔ)義網(wǎng)絡(luò),是一階謂詞邏輯的簡(jiǎn)化形式,并在實(shí)際應(yīng)用中通過(guò)定義大量的概念和關(guān)系類(lèi)型豐富了語(yǔ)義網(wǎng)絡(luò)的內(nèi)涵。一方面,它能夠描述概念、事實(shí)、規(guī)則等各個(gè)層次的認(rèn)知知識(shí);另一方面,它也能夠有效組織和描述人類(lèi)在自然環(huán)境和社會(huì)活動(dòng)中形成的海量數(shù)據(jù),從而為各類(lèi)人工智能應(yīng)用系統(tǒng)奠定知識(shí)基礎(chǔ)。描述形式統(tǒng)一,便于不同類(lèi)型知識(shí)的集成與融合本體(Ontology)和分類(lèi)系統(tǒng)(Taxonomy)是典型的知識(shí)描述載體,數(shù)據(jù)庫(kù)是典型的實(shí)例數(shù)據(jù)載體,它們的描述形式截然不同。知識(shí)圖譜以語(yǔ)義網(wǎng)的資源描述框架(ResourceDescriptionFramework,RDF)規(guī)范形式對(duì)知識(shí)描述和實(shí)例數(shù)據(jù)進(jìn)行統(tǒng)一表示,并通過(guò)對(duì)齊、匹配等操作對(duì)異構(gòu)知識(shí)進(jìn)行集成和融合,從而支撐更豐富、更靈活的知識(shí)服務(wù)。表示方法對(duì)人類(lèi)友好,給眾包等方式編輯和構(gòu)建知識(shí)提供了便利傳統(tǒng)知識(shí)表示方法和描述語(yǔ)言需要知識(shí)工程師具備一定的專業(yè)知識(shí),普通人群難以操作。知識(shí)圖譜以實(shí)體和實(shí)體關(guān)系為基礎(chǔ)的簡(jiǎn)潔表示形式,無(wú)論是專家還是普通民眾都容易接受,這給以眾包等方式編輯和構(gòu)建知識(shí)提供了便利,為大眾參與大規(guī)模知識(shí)構(gòu)建提供了低認(rèn)知成本的保證。知識(shí)圖譜的特點(diǎn)二元關(guān)系為基礎(chǔ)的描述形式,便于知識(shí)的自動(dòng)獲取知識(shí)圖譜對(duì)各種類(lèi)型知識(shí)采取統(tǒng)一的二元關(guān)系進(jìn)行定義和描述,為基于自然語(yǔ)言處理和機(jī)器學(xué)習(xí)方法進(jìn)行知識(shí)的自動(dòng)獲取提供便利,為大規(guī)模、跨領(lǐng)域、高覆蓋的知識(shí)采集提供技術(shù)保障。表示方法對(duì)計(jì)算機(jī)友好,支持高效推理推理是知識(shí)表示的重要目標(biāo),傳統(tǒng)方法在進(jìn)行知識(shí)推理時(shí)復(fù)雜度很高,難以快速有效地處理。知識(shí)圖譜的表示形式以圖結(jié)構(gòu)為基礎(chǔ),結(jié)合圖論相關(guān)算法的前沿技術(shù),利用對(duì)節(jié)點(diǎn)和路徑的遍歷搜索,可以有效提高推理效率,極大降低計(jì)算機(jī)處理成本?;趫D結(jié)構(gòu)的數(shù)據(jù)格式,便于計(jì)算機(jī)系統(tǒng)存儲(chǔ)與檢索知識(shí)圖譜以三元組為基礎(chǔ),使得在數(shù)據(jù)的標(biāo)準(zhǔn)化方面更容易推廣,相應(yīng)的工具更便于統(tǒng)一。結(jié)合圖數(shù)據(jù)庫(kù)技術(shù)以及語(yǔ)義網(wǎng)描述體系、標(biāo)準(zhǔn)和工具,為計(jì)算機(jī)系統(tǒng)對(duì)大規(guī)模知識(shí)系統(tǒng)的存儲(chǔ)與檢索提供技術(shù)保障。知識(shí)圖譜的特點(diǎn)第二章:知識(shí)表示《知識(shí)圖譜》配套講義90提綱概述經(jīng)典知識(shí)表示理論語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)91提綱概述經(jīng)典知識(shí)表示理論語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)92知識(shí)表示的五個(gè)主要角色一種代理一組本體論約定的集合智能推理的組成部分高效計(jì)算的媒介人類(lèi)表達(dá)的媒介RandallDavis,“WhatisaKnowledgeRepresentation?”MITAILab,AIMagazine,199393知識(shí)類(lèi)型陳述性知識(shí)(declarativeknowledge):用于描述領(lǐng)域內(nèi)有關(guān)概念、事物的屬性和狀態(tài)等事實(shí)。太陽(yáng)從東方升起一年有春夏秋冬四個(gè)季節(jié)過(guò)程性知識(shí)(proceduralknowledge):用于指出如何處理與領(lǐng)域相關(guān)的信息,以求得問(wèn)題的解。主要描述過(guò)程和規(guī)則知識(shí)。菜譜中的炒菜步驟如果信道暢通,請(qǐng)發(fā)綠色信號(hào)94知識(shí)類(lèi)型語(yǔ)言知識(shí)(linguisticknowledge):用于描述刻畫(huà)詞語(yǔ)之間的語(yǔ)義聯(lián)系。開(kāi)心、喜悅、歡喜、快樂(lè)、高興悲痛、痛苦、難過(guò)、悲傷、哀傷世界知識(shí)(proceduralknowledge):用于描述具體實(shí)體,包括實(shí)體的屬性、實(shí)體間的關(guān)系、以及一些重大事件等。姚明的妻子是葉莉第24屆冬季奧林匹克運(yùn)動(dòng)會(huì)在中國(guó)舉辦常識(shí)知識(shí)(metaknowledge):還有許多對(duì)人類(lèi)來(lái)說(shuō)不言自明,但長(zhǎng)期難以被機(jī)器處理的知識(shí)。(大多數(shù))鳥(niǎo)會(huì)飛翔95語(yǔ)言知識(shí)主要由語(yǔ)言學(xué)專家編纂,刻畫(huà)詞語(yǔ)之間的語(yǔ)義聯(lián)系聚合語(yǔ)義:關(guān)注詞語(yǔ)、概念的層次關(guān)聯(lián)組合語(yǔ)義:關(guān)注框架和語(yǔ)義角色WordNet(語(yǔ)義網(wǎng)絡(luò))FrameNet(框架)96世界知識(shí)我們熟知的通用目的知識(shí)庫(kù)(DBpedia、Wikidata等)主要關(guān)注世界知識(shí)*主要描述具體實(shí)體,包括實(shí)體的屬性、實(shí)體間的關(guān)系,以及一些重大事件等基于語(yǔ)義網(wǎng)絡(luò)理論,遵守語(yǔ)義網(wǎng)標(biāo)準(zhǔn),共享技術(shù)棧(RDF、OWL、SPARQL、SHACL等),開(kāi)放互聯(lián)例1YAGO4:

yago:London,schema:location,yago:Great_Britain例2Wikidata:[<Q58590>,<P26>,<Q986169>],<P580>,“2007”

[(姚明)(配偶)(葉莉)](起始時(shí)間)200797世界知識(shí)例3wikipedia:98常識(shí)知識(shí)對(duì)人類(lèi)來(lái)說(shuō)不言自明,但長(zhǎng)期難以被機(jī)器處理的知識(shí)所謂的“常識(shí)知識(shí)”(大多數(shù))鳥(niǎo)會(huì)飛翔生病的人會(huì)想要去醫(yī)院買(mǎi)書(shū)的前提是前往書(shū)店吃一頓飯需要幾分鐘到一兩小時(shí)的時(shí)間不能把一整頭大象放入家用冰箱有許多工作致力于組織、收集常識(shí)知識(shí):CYC、ConceptNet(OMCS、MIT)、Atomic(AI2、華盛頓大學(xué))等99常識(shí)知識(shí)常識(shí)知識(shí)的很難被精確地定義Wikipedia:“所有人都應(yīng)當(dāng)知道的,有關(guān)日常世界的事實(shí)。”DARPA:“……這些共享的,不表達(dá)的背景知識(shí)(常識(shí)知識(shí))包括對(duì)物理世界如何工作的一般理解(直觀物理學(xué)),對(duì)人類(lèi)動(dòng)機(jī)和行為的基本理解(直觀心理學(xué)),以及普通成年人應(yīng)當(dāng)了解的一般事實(shí)?!?00常識(shí)知識(shí)特點(diǎn)概括性:常識(shí)通常是一類(lèi)事物共享的事實(shí)、規(guī)律,而非特定實(shí)例獨(dú)有隱含性:常識(shí)知識(shí)對(duì)交流者顯而易見(jiàn),很少去專門(mén)直接表達(dá)普遍性:大多數(shù)人都普遍掌握的知識(shí)不確定性:許多常識(shí)知識(shí)是默認(rèn)或可能成立的事實(shí),而非必然的真理(大多數(shù))鳥(niǎo)會(huì)飛、發(fā)生車(chē)禍可能引起交通擁堵101常識(shí)知識(shí)現(xiàn)有研究關(guān)注的常見(jiàn)類(lèi)型:事物的類(lèi)屬、相似、部分-整體關(guān)系:鳥(niǎo)是一種脊椎動(dòng)物物體的用途、生物的能力:魚(yú)會(huì)潛水物體的物理屬性:顏色、形狀、材質(zhì)、大小物體的常見(jiàn)空間位置:盤(pán)子放置于櫥柜事件與狀態(tài)的時(shí)序聯(lián)系:起床之后洗漱、出門(mén)事件與狀態(tài)的前提、因果聯(lián)系:地震會(huì)引發(fā)海嘯事件參與者的意圖、目標(biāo):買(mǎi)食品的目的是為了充饑社交活動(dòng)中的影響、感受:擁抱朋友會(huì)感到快樂(lè)……102常識(shí)知識(shí)早期常識(shí)知識(shí)項(xiàng)目采用較形式化的表示方案著名的Cyc項(xiàng)目,使用擴(kuò)展的一階邏輯語(yǔ)言表示需要經(jīng)過(guò)專業(yè)訓(xùn)練的專家編寫(xiě)知識(shí),成本高昂當(dāng)下活躍的常識(shí)項(xiàng)目主要采用“自由形式”的表示用預(yù)定義關(guān)系連接自然語(yǔ)言短語(yǔ),減輕了為常識(shí)設(shè)計(jì)形式化方案的負(fù)擔(dān)使得大眾可以參與到常識(shí)知識(shí)的收集工作中ConceptNet(語(yǔ)義網(wǎng)絡(luò))ATOMIC(語(yǔ)義網(wǎng)絡(luò))103知識(shí)表示從四個(gè)層次介紹各種知識(shí)表示方法:人工智能和知識(shí)工程中的經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則、語(yǔ)義網(wǎng)絡(luò)、框架、腳本一階謂詞邏輯、描述邏輯語(yǔ)義網(wǎng)的知識(shí)描述體系XML、RDF、RDFs、OWL、RIF知識(shí)圖譜中的知識(shí)表示方法DBPediaWikiData數(shù)值化知識(shí)表示方法104知識(shí)表示從四個(gè)層次介紹各種知識(shí)表示方法:人工智能和知識(shí)工程中的經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則、語(yǔ)義網(wǎng)絡(luò)、框架、腳本一階謂詞邏輯、描述邏輯語(yǔ)義網(wǎng)的知識(shí)描述體系XML、RDF、RDFs、OWL、RIF知識(shí)圖譜中的知識(shí)表示方法DBPediaWikiData數(shù)值化知識(shí)表示方法105提綱概述經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則表示法語(yǔ)義網(wǎng)絡(luò)表示法框架表示法腳本表示法一階謂詞邏輯表示法描述邏輯表示法語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)106產(chǎn)生式系統(tǒng)依據(jù)人腦認(rèn)知中的各種知識(shí)之間大量存在的因果關(guān)系,以規(guī)則序列的形式來(lái)描述問(wèn)題的思維過(guò)程,并據(jù)此進(jìn)行問(wèn)題求解的一種人工智能系統(tǒng)。其中,系統(tǒng)中的每一條規(guī)則稱為一個(gè)產(chǎn)生式規(guī)則。產(chǎn)生式規(guī)則表示法是專家系統(tǒng)最常用的知識(shí)表示方式,也是人工智能中應(yīng)用最多的一種知識(shí)表示方式。107專家系統(tǒng)專家系統(tǒng):是早期人工智能的一個(gè)重要分支,它可以看作是一類(lèi)具有專門(mén)知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能程序系統(tǒng),一般采用人工智能中的知識(shí)表示和知識(shí)推理技術(shù)來(lái)模擬通常由領(lǐng)域?qū)<也拍芙鉀Q的復(fù)雜問(wèn)題。一般來(lái)說(shuō),專家系統(tǒng)=知識(shí)庫(kù)+推理機(jī),因此專家系統(tǒng)也被稱為基于知識(shí)的系統(tǒng)。產(chǎn)生式規(guī)則表示法是專家系統(tǒng)最常用的知識(shí)表示方式。108基本術(shù)語(yǔ):事實(shí)事實(shí):斷言一個(gè)語(yǔ)言變量的值或斷言多個(gè)語(yǔ)言變量之間關(guān)系的陳述句。雪是白的語(yǔ)言變量:雪;語(yǔ)言變量的值:白的小王與小張同齡語(yǔ)言變量:小王、小張;語(yǔ)言變量之間的關(guān)系:同齡農(nóng)行電話是95599語(yǔ)言變量:農(nóng)行;語(yǔ)言變量的值:95599農(nóng)行與建行同屬中國(guó)四大銀行語(yǔ)言變量:農(nóng)行、建行;語(yǔ)言變量之間的關(guān)系:同屬中國(guó)四大銀行109基本術(shù)語(yǔ):事實(shí)事實(shí)的符號(hào)化表示確定性事實(shí):一般用三元組的形式表示為(對(duì)象,屬性,值)或(關(guān)系,對(duì)象1,對(duì)象2)(雪,顏色,白的),(同齡,小王,小張)(農(nóng)行,電話,95599),(同屬中國(guó)四大銀行,農(nóng)行,建行)不確定性事實(shí):一般用四元組的形式表示為(對(duì)象,屬性,值,置信度)(關(guān)系,對(duì)象1,對(duì)象2,置信度)(今年?duì)I業(yè)額并列全國(guó)第一,農(nóng)行,建行,0.00006)-此處概率僅教學(xué)示例,非真實(shí)數(shù)據(jù)110基本術(shù)語(yǔ):規(guī)則

111基本術(shù)語(yǔ):規(guī)則

112產(chǎn)生式系統(tǒng)結(jié)構(gòu)產(chǎn)生式系統(tǒng)(productionsystem)由數(shù)據(jù)庫(kù)、規(guī)則庫(kù)和推理機(jī)三部分組成。數(shù)據(jù)庫(kù):用來(lái)存放問(wèn)題的初始狀態(tài)、已知事實(shí)、推理的中間結(jié)果和最終結(jié)論等。規(guī)則庫(kù):用來(lái)存放與求解問(wèn)題有關(guān)的所有規(guī)則。推理機(jī):用來(lái)控制整個(gè)系統(tǒng)的運(yùn)行,決定問(wèn)題求解的線路,包括匹配、沖突消解、路徑解釋等。數(shù)據(jù)庫(kù)規(guī)則庫(kù)推理機(jī)113正向推理的產(chǎn)生式系統(tǒng)正向推理:從已知事實(shí)出發(fā),通過(guò)規(guī)則求得結(jié)論,也稱為數(shù)據(jù)驅(qū)動(dòng)方式或自底向上的方式。推理過(guò)程:規(guī)則庫(kù)中的規(guī)則前件與數(shù)據(jù)庫(kù)中的事實(shí)進(jìn)行匹配,得到匹配的規(guī)則集合;使用沖突消解算法,從匹配規(guī)則集合中選擇一條規(guī)則作為啟用規(guī)則;執(zhí)行啟用規(guī)則的后件,并將該規(guī)則的后件送入數(shù)據(jù)庫(kù);重復(fù)上述過(guò)程直至達(dá)到目標(biāo)。114反向推理的產(chǎn)生式系統(tǒng)反向推理:從目標(biāo)出發(fā),反向使用規(guī)則,求得已知事實(shí),也稱為目標(biāo)驅(qū)動(dòng)方式或自頂向下的方式。推理過(guò)程:規(guī)則庫(kù)中的規(guī)則后件與目標(biāo)事實(shí)進(jìn)行匹配,得到匹配的規(guī)則集合;使用沖突消解算法,從匹配規(guī)則集合中選擇一條規(guī)則作為啟用規(guī)則;將啟用規(guī)則的前件作為子目標(biāo);重復(fù)上述過(guò)程直至各子目標(biāo)均為已知事實(shí)。115產(chǎn)生式規(guī)則表示法特性優(yōu)點(diǎn):有效性:既可以表示確定性知識(shí),又可以表示不確定性知識(shí),有利于過(guò)程性知識(shí)的表達(dá)。自然性:用“如果…,則…”表示知識(shí),直觀、自然。一致性:所有規(guī)則具有相同的格式,并且數(shù)據(jù)庫(kù)可被所有規(guī)則訪問(wèn),便于統(tǒng)一處理。模塊化:各條規(guī)則之間只能通過(guò)數(shù)據(jù)庫(kù)發(fā)生聯(lián)系,不能相互調(diào)用,便于知識(shí)的添加、刪除和修改。缺點(diǎn):表示的局限性:不能表示結(jié)構(gòu)性或?qū)哟涡灾R(shí)。效率低:求解是反復(fù)進(jìn)行的“匹配—沖突消解—執(zhí)行”過(guò)程,執(zhí)行效率低。116提綱概述經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則表示法語(yǔ)義網(wǎng)絡(luò)表示法框架表示法腳本表示法一階謂詞邏輯表示法描述邏輯表示法語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)117語(yǔ)義網(wǎng)絡(luò)(SemanticNetwork)是Quillan1966年在研究人類(lèi)聯(lián)想記憶時(shí)提出的一種心理學(xué)模型。這種思想受到以下兩點(diǎn)的啟發(fā):1)人腦記憶的一個(gè)重要特征是人腦中不同信息片段之間的高度連接;2)高度相關(guān)的概念能夠比不太相關(guān)的概念更快地回憶起來(lái)。因此,該模型認(rèn)為人類(lèi)的記憶是由概念間的聯(lián)系實(shí)現(xiàn)的,進(jìn)而他提出語(yǔ)義網(wǎng)絡(luò)的知識(shí)表示方法。118語(yǔ)義網(wǎng)絡(luò)語(yǔ)義網(wǎng)絡(luò)是一種有向圖表示的知識(shí)系統(tǒng),節(jié)點(diǎn)代表的是概念,而邊則表示這些概念之間的語(yǔ)義關(guān)系。語(yǔ)義網(wǎng)絡(luò)中最基本的語(yǔ)義單元稱為語(yǔ)義基元,可以用三元組形式表示:<節(jié)點(diǎn)1,關(guān)系,節(jié)點(diǎn)2>。PersonmanagerTomemployeeJohnpunchingeventisaisobjectagentManage-ofisisisa119語(yǔ)義網(wǎng)絡(luò)的關(guān)系isa:具體-抽象關(guān)系,或者隸屬關(guān)系,體現(xiàn)某種層次分類(lèi)。鳥(niǎo)類(lèi)動(dòng)物ISA銀行金融機(jī)構(gòu)ISA農(nóng)行銀行ISA120語(yǔ)義網(wǎng)絡(luò)的關(guān)系part-of:部分-整體關(guān)系。顯示器電腦Part-of柜臺(tái)銀行Part-ofATM銀行Part-of121語(yǔ)義網(wǎng)絡(luò)的關(guān)系屬性關(guān)系:事物和屬性之間的關(guān)系。老張40年齡農(nóng)行1951成立時(shí)間建行北京總部位于122語(yǔ)義網(wǎng)絡(luò)的關(guān)系語(yǔ)義基元可以是事實(shí)或規(guī)則,它們的語(yǔ)義網(wǎng)絡(luò)表示是相同的,區(qū)別只是邊上的標(biāo)注事實(shí):規(guī)則:雪白色顏色ATM取款鎖卡密碼輸錯(cuò)超過(guò)5次農(nóng)行95599電話號(hào)碼華為P40Pro+5G網(wǎng)絡(luò)123語(yǔ)義網(wǎng)絡(luò)對(duì)多元關(guān)系的表達(dá)可以按照論元個(gè)數(shù)把關(guān)系分為一元、二元和多元關(guān)系。一元關(guān)系:

“鳥(niǎo)有翅膀”

“魚(yú)能游泳”

“銀行有柜臺(tái)”

“華為P40Pro+支持5G網(wǎng)絡(luò)”二元關(guān)系:

“北京是中國(guó)的首都”,首都(中國(guó),北京)“農(nóng)行是中國(guó)國(guó)有銀行”,國(guó)有銀行(農(nóng)行,中國(guó))

124語(yǔ)義網(wǎng)絡(luò)對(duì)多元關(guān)系的表達(dá)可以按照論元個(gè)數(shù)把關(guān)系分為一元、二元和多元關(guān)系。多元關(guān)系:“第24屆冬季奧運(yùn)會(huì)2022年在北京舉辦?!卑伺e辦地和舉辦時(shí)間兩個(gè)二元關(guān)系“農(nóng)行1951年在北京成立?!卑顺闪⒌睾统闪r(shí)間兩個(gè)二元關(guān)系125語(yǔ)義網(wǎng)絡(luò)對(duì)多元關(guān)系的表達(dá)一元關(guān)系和二元關(guān)系可以方便地用語(yǔ)義網(wǎng)絡(luò)進(jìn)行表示多元關(guān)系轉(zhuǎn)化為多個(gè)二元關(guān)系的組合,然后利用合取把這種多元關(guān)系表示出來(lái)。1951X北京銀行成立事件成立時(shí)間成立地點(diǎn)是一個(gè)2022X北京冬奧會(huì)舉辦事件舉辦時(shí)間舉辦地點(diǎn)是一個(gè)126語(yǔ)義網(wǎng)絡(luò)系統(tǒng)語(yǔ)義網(wǎng)絡(luò)系統(tǒng)由知識(shí)庫(kù)和推理機(jī)兩部分構(gòu)成。知識(shí)庫(kù):語(yǔ)義網(wǎng)絡(luò)表示推理機(jī):求解問(wèn)題的程序問(wèn)題求解過(guò)程:把求解目標(biāo)表示為一個(gè)語(yǔ)義網(wǎng)絡(luò)子圖,其中有些節(jié)點(diǎn)或者邊的標(biāo)識(shí)是缺失的,表示求解目標(biāo)。基于求解問(wèn)題子圖,從知識(shí)庫(kù)中搜索可以匹配的網(wǎng)絡(luò)片段,從而找出目標(biāo)信息。這種匹配一般是不完全的,具有不確定性,需要考慮不確定匹配問(wèn)題。127語(yǔ)義網(wǎng)絡(luò)系統(tǒng)的特性優(yōu)點(diǎn):使用直觀的圖結(jié)構(gòu)來(lái)描述知識(shí),表達(dá)自然,而且方便于計(jì)算機(jī)的存儲(chǔ)和檢索,有較為成熟的應(yīng)用。缺點(diǎn):由于缺少形式化的語(yǔ)義定義,不同的語(yǔ)義網(wǎng)絡(luò)之間難以互相操作,表示不完善。用節(jié)點(diǎn)及其關(guān)系描述知識(shí),并通過(guò)臨時(shí)性(ad-hoc)的過(guò)程對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行操作,從而實(shí)現(xiàn)推理。推理過(guò)程復(fù)雜。128提綱概述經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則表示法語(yǔ)義網(wǎng)絡(luò)表示法框架表示法腳本表示法一階謂詞邏輯表示法描述邏輯表示法語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)129框架表示法是以框架理論為基礎(chǔ)發(fā)展起來(lái)的一種結(jié)構(gòu)化知識(shí)表示方式,適用于表達(dá)多種類(lèi)型的知識(shí)。框架理論認(rèn)為人們將現(xiàn)實(shí)生活中各種事物的背景知識(shí)以某種框架形式存儲(chǔ)在記憶中,當(dāng)面臨一個(gè)新事物時(shí),就從記憶中找出一個(gè)適合的框架,并根據(jù)實(shí)際情況對(duì)其細(xì)節(jié)加以修改補(bǔ)充,從而對(duì)當(dāng)前事物進(jìn)行解釋和理解。130框架框架(frame):是一種描述所論對(duì)象屬性的數(shù)據(jù)結(jié)構(gòu)??蚣苊河脕?lái)指代某一類(lèi)或某一個(gè)對(duì)象。槽:用來(lái)表示對(duì)象的某個(gè)方面的屬性。側(cè)面:有時(shí)一個(gè)屬性還要從不同側(cè)面來(lái)描述。值:槽/側(cè)面的取值,可以為原子型,也可以為集合型。<框架名>槽名1側(cè)面名11側(cè)面值11側(cè)面名12側(cè)面值12槽名2側(cè)面名21側(cè)面值21側(cè)面名22側(cè)面值22槽名n131框架框架分為兩種類(lèi)型:類(lèi)框架(classframe):用于描述一個(gè)概念或一類(lèi)對(duì)象。實(shí)例框架(instanceframe):用于描述一個(gè)具體的對(duì)象。框架的層次結(jié)構(gòu):子類(lèi)-subclassof->父類(lèi):類(lèi)框架之間的包含關(guān)系。實(shí)例-instanceof->類(lèi):實(shí)例框架和類(lèi)框架的從屬關(guān)系。下層框架可以從上層框架繼承某些屬性和值。后文對(duì)兩者不做區(qū)分,統(tǒng)稱為“類(lèi)屬”關(guān)系。132框架示例框架名:<災(zāi)難>時(shí)間:地點(diǎn):傷亡:死亡人數(shù):受傷人數(shù):失蹤人數(shù):損失:直接經(jīng)濟(jì)損失:間接經(jīng)濟(jì)損失:框架名:<地震>類(lèi)屬:<災(zāi)難>震級(jí):震源深度:斷層:框架名:<汶川地震>類(lèi)屬:<地震>時(shí)間:2008年5月12日14時(shí)28分04秒地點(diǎn):汶川傷亡:死亡人數(shù):69227人受傷人數(shù):374643人失蹤人數(shù):17923人損失:直接經(jīng)濟(jì)損失:8452億元震級(jí):8.0級(jí)汶川地震是中華人民共和國(guó)自建國(guó)以來(lái)影響最大的一次地震,發(fā)生于2008年5月12日14時(shí)28分04秒,里氏震級(jí)8.0級(jí),直接嚴(yán)重受災(zāi)地區(qū)達(dá)10萬(wàn)平方公里。這次地震危害極大,共遇難69227人,受傷374643人,失蹤17923人。其中四川省68712名同胞遇難,17921名同胞失蹤,共有5335名學(xué)生遇難,1000多名失蹤。直接經(jīng)濟(jì)損失8452億元。133框架系統(tǒng)學(xué)生框架教職工框架師生職工框架計(jì)算機(jī)系學(xué)生電子系學(xué)生碩士生本科生學(xué)生-N學(xué)生-1134框架系統(tǒng)銀行框架證券機(jī)構(gòu)框架金融機(jī)構(gòu)框架商業(yè)銀行政策性銀行中國(guó)建設(shè)銀行中國(guó)農(nóng)業(yè)銀行135框架系統(tǒng)的推理機(jī)制繼承推理:框架表示具有分類(lèi)、分層的特點(diǎn),下層框架可以繼承上層框架的信息。匹配推理:推理目標(biāo):找出“震級(jí)在7級(jí)以上,死亡人數(shù)在1-萬(wàn)人以上的地震”框架名:<汶川地震>類(lèi)屬:<地震>時(shí)間:2008年5月12日地點(diǎn):汶川傷亡:死亡人數(shù):69227人受傷人數(shù):374643人失蹤人數(shù):17923人損失:直接經(jīng)濟(jì)損失:8452億元震級(jí):8.0級(jí)框架名:<唐山地震>類(lèi)屬:<地震>時(shí)間:1976年7月28日地點(diǎn):唐山開(kāi)平區(qū)傷亡:死亡人數(shù):242769人受傷人數(shù):435556人失蹤人數(shù):損失:直接經(jīng)濟(jì)損失:30億元震級(jí):7.8級(jí)框架名:<??>類(lèi)屬:<地震>時(shí)間:地點(diǎn):傷亡:死亡人數(shù):10萬(wàn)人以上受傷人數(shù):失蹤人數(shù):損失:直接經(jīng)濟(jì)損失:震級(jí):7級(jí)以上136框架表示法特性優(yōu)點(diǎn):自然性:框架理論符合人類(lèi)認(rèn)知的思維過(guò)程。結(jié)構(gòu)化:分層次嵌套式結(jié)構(gòu),既可以表示知識(shí)的內(nèi)部結(jié)構(gòu),又可以表示知識(shí)之間的聯(lián)系。繼承性:下層框架可以從上層框架繼承某些屬性或值,也可以進(jìn)行補(bǔ)充修改,減少冗余信息并節(jié)省存儲(chǔ)空間。模塊化:每個(gè)框架是相對(duì)獨(dú)立的數(shù)據(jù)結(jié)構(gòu),便于知識(shí)的添加、刪除和修改。缺點(diǎn):框架表示法也有不可避免的缺陷,由于真實(shí)世界的多樣性和復(fù)雜性,許多實(shí)際情況與框架原型存在較大的差異,在框架設(shè)計(jì)中難免引入錯(cuò)誤或沖突。不能表示過(guò)程性知識(shí)。缺乏明確的推理機(jī)制。137代表性知識(shí)庫(kù):FrameNet1針對(duì)詞匯的概念進(jìn)行框架形式的建模1/fndrupal/138代表性知識(shí)庫(kù):FrameNet1針對(duì)詞匯的概念進(jìn)行框架形式的建模1/fndrupal/框架名Frameelements:框架元素139代表性知識(shí)庫(kù):FrameNet1針對(duì)詞匯的概念進(jìn)行框架形式的建模1/fndrupal/非核心框架元素140代表性知識(shí)庫(kù):FrameNet1針對(duì)詞匯的概念進(jìn)行框架形式的建模1/fndrupal/框架間關(guān)系詞法單元,表示最能觸發(fā)該框架的詞141提綱概述經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則表示法語(yǔ)義網(wǎng)絡(luò)表示法框架表示法腳本表示法一階謂詞邏輯表示法描述邏輯表示法語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)142腳本是一種與框架類(lèi)似的知識(shí)表示方法,由一組槽組成,用來(lái)表示特定領(lǐng)域內(nèi)一些事件的發(fā)生序列,類(lèi)似于電影劇本。腳本表示的知識(shí)有明確的時(shí)間或因果順序,必須是前一個(gè)動(dòng)作完成后才會(huì)觸發(fā)下一個(gè)動(dòng)作。與框架相比,腳本用來(lái)描述一個(gè)過(guò)程而非靜態(tài)知識(shí)。143腳本W(wǎng)inston一個(gè)腳本(script)是一個(gè)事件序列,包含了緊密相關(guān)的動(dòng)作及改變狀態(tài)的框架。Luger-Stubblfield一個(gè)腳本是一個(gè)描述特定上下文中的原型事件序列(ste-reotypedeventsequence)的結(jié)構(gòu)化表示。144腳本組成進(jìn)入條件:給出腳本中所描述事件的前提條件。角色:用來(lái)描述事件中可能出現(xiàn)的人物。道具:用來(lái)描述事件中可能出現(xiàn)的相關(guān)物體。場(chǎng)景:用來(lái)描述事件發(fā)生的真實(shí)順序。一個(gè)事件可以由多個(gè)場(chǎng)景組成,而每個(gè)場(chǎng)景又可以是其他事件的腳本。結(jié)果:給出在腳本所描述事件發(fā)生以后所產(chǎn)生的結(jié)果。145腳本示例例:用腳本表示去餐廳吃飯(1)進(jìn)入條件:①顧客餓了,需要進(jìn)餐;②顧客有足夠的錢(qián)。(2)角色:顧客,服務(wù)員,廚師,老板。(3)道具:食品,桌子,菜單,賬單,錢(qián)。(4)場(chǎng)景:場(chǎng)景1:進(jìn)入——①顧客進(jìn)入餐廳;②尋找桌子;③在桌子旁坐下。場(chǎng)景2:點(diǎn)菜——①服務(wù)員給顧客菜單;②顧客點(diǎn)菜;③顧客把菜單還給服務(wù)員;④顧客等待服務(wù)員送菜。場(chǎng)景3:等待——①服務(wù)員告訴廚師顧客所點(diǎn)的菜;②廚師做菜,顧客等待。場(chǎng)景4:吃飯——①?gòu)N師把做好的送給服務(wù)員;②服務(wù)員把菜送給顧客;③顧客吃菜。場(chǎng)景5:離開(kāi)——①服務(wù)員拿來(lái)賬單;②顧客付錢(qián)給服務(wù)員;③顧客離開(kāi)餐廳。(5)結(jié)果:①顧客吃了飯,不餓了;②顧客花了錢(qián);③老板賺了錢(qián);④餐廳食品少了。146腳本示例例:用腳本表示去銀行柜臺(tái)存錢(qián)(1)進(jìn)入條件:①客戶有大額的現(xiàn)金;②客戶有時(shí)間。(2)角色:客戶,柜員,保安。(3)道具:取號(hào)機(jī),椅子,凳子,證件材料,憑條,銀行卡。(4)場(chǎng)景:場(chǎng)景1:取號(hào)——①客戶進(jìn)入銀行;②尋找取號(hào)機(jī);③用取號(hào)機(jī)取號(hào)。場(chǎng)景3:等待——①拿走號(hào)碼;②尋找椅子坐下;③等待叫號(hào)。場(chǎng)景4:辦理業(yè)務(wù)——①機(jī)器叫號(hào);②到對(duì)應(yīng)窗口凳子坐下;③出示銀行卡和證件材料;

④辦理存錢(qián)業(yè)務(wù)。場(chǎng)景5:離開(kāi)——①拿好憑條;②客戶離開(kāi)銀行。

(5)結(jié)果:①顧客身上沒(méi)有了大額現(xiàn)金;②顧客花了時(shí)間;③銀行多了錢(qián)。147腳本表示法的推理事件的預(yù)測(cè)給定一個(gè)場(chǎng)景,如果已知某個(gè)腳本適應(yīng)這個(gè)場(chǎng)景,則可以據(jù)此預(yù)測(cè)沒(méi)有提及的事件發(fā)生。“約翰訂購(gòu)牛排”可以預(yù)測(cè)“約翰付清賬單”“小明要存大量現(xiàn)金”可以預(yù)測(cè)“小明去銀行柜臺(tái)”指明事件之間的聯(lián)系腳本存儲(chǔ)了事件表達(dá)的因果鏈“某人訂購(gòu)牛排”和“某人吃牛排”之間是因果關(guān)系“某人要存大量現(xiàn)金”和“某人去銀行”之間是因果關(guān)系148腳本表示法的推理鑒別特殊事件的發(fā)生“約翰走進(jìn)餐廳。他被帶到餐桌旁。訂了一大塊牛排之后,他坐在那兒等了很久。后來(lái),他生氣地走了?!边@個(gè)情節(jié)中的重要部分是:改變了曾預(yù)測(cè)的餐廳事件序列,“付賬單”事件沒(méi)有出現(xiàn),說(shuō)明是一個(gè)非常規(guī)的事件?!靶∶髯哌M(jìn)銀行。他看到很多人在等待。他不耐煩地走了?!边@個(gè)情節(jié)中的重要部分是:改變了曾預(yù)測(cè)的銀行事件序列,“取號(hào)”等事件沒(méi)有出現(xiàn),說(shuō)明是一個(gè)非常規(guī)的事件。149腳本表示法特性優(yōu)點(diǎn):在非常狹小的領(lǐng)域內(nèi),腳本表示卻可以更細(xì)致地刻畫(huà)步驟和時(shí)序關(guān)系,適合于表達(dá)預(yù)先構(gòu)思好的特定知識(shí)或順序性動(dòng)作及事件,如故事情節(jié)理解、智能對(duì)話系統(tǒng)、機(jī)票酒店預(yù)訂等。缺點(diǎn):相較于框架表示,腳本表示表達(dá)能力更受約束,表示范圍更窄,不具備對(duì)于對(duì)象基本屬性的描述能力,也難以描述復(fù)雜事件發(fā)展的可能方向。150基于槽的表示語(yǔ)義網(wǎng)絡(luò)、框架和腳本都屬于基于槽的表示方法。主要區(qū)別在于槽是否具有層次、時(shí)序、控制關(guān)系(條件分支結(jié)構(gòu))。語(yǔ)義網(wǎng)絡(luò)是最簡(jiǎn)單的一種,它的每個(gè)三元組都可以看成一個(gè)槽結(jié)構(gòu)??蚣芟到y(tǒng)由一組相關(guān)的框架聯(lián)結(jié)而成,其中每個(gè)框架是由若干節(jié)點(diǎn)和關(guān)系構(gòu)成的網(wǎng)絡(luò)。因此,框架可以看成是層次化的語(yǔ)義網(wǎng)絡(luò),是語(yǔ)義網(wǎng)絡(luò)的一般化形式。腳本是按照一定的時(shí)間流程對(duì)事件的發(fā)展和變換控制進(jìn)行的建模,因此,可以認(rèn)為是定義了時(shí)間和控制條件的槽結(jié)構(gòu),與語(yǔ)義網(wǎng)絡(luò)也沒(méi)有本質(zhì)區(qū)別。151提綱概述經(jīng)典知識(shí)表示理論產(chǎn)生式規(guī)則表示法語(yǔ)義網(wǎng)絡(luò)表示法框架表示法腳本表示法一階謂詞邏輯表示法描述邏輯表示法語(yǔ)義網(wǎng)中的知識(shí)表示方法知識(shí)圖譜中的知識(shí)表示方法知識(shí)圖譜的數(shù)值化表示方法總結(jié)152一階謂詞邏輯是人們發(fā)明的一套悠久而成熟的形式系統(tǒng),是經(jīng)典邏輯學(xué)的核心,在數(shù)學(xué)、哲學(xué)、語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域有廣泛的研究和應(yīng)用。相比語(yǔ)義網(wǎng)絡(luò)、框架和腳本等經(jīng)典知識(shí)表示方法,一階謂詞邏輯有精確的形式化定義,容易用算法實(shí)現(xiàn),便于機(jī)器理解和操作,支持精確推理,因此也很適合在人工智能系統(tǒng)中表示知識(shí)。153命題邏輯:基本概念命題(proposition):具有真假意義的陳述句,是對(duì)客觀事實(shí)的描述。這款手機(jī)價(jià)格低廉。這款手機(jī)配置好且價(jià)格低廉。如果這款手機(jī)配置好且價(jià)格低廉,那么它的銷(xiāo)量就好。農(nóng)行是國(guó)有銀行。農(nóng)行是國(guó)有銀行且服務(wù)好。如果農(nóng)行是國(guó)有銀行且服務(wù)好,那么客戶就多。154命題邏輯:基本概念原子命題:又稱簡(jiǎn)單命題,不包含其他命題作為其組成部分的命題,即在結(jié)構(gòu)上不能再分解出其他命題的命題。P:這款手機(jī)配置好。Q:這款手機(jī)價(jià)格低廉。R:這款手機(jī)銷(xiāo)量好。P:農(nóng)行是國(guó)有銀行。Q:農(nóng)行服務(wù)好。R:農(nóng)行客戶多。155命題邏輯:基本概念

156命題邏輯:表示法命題邏輯:由命題及其邏輯關(guān)聯(lián)表示客觀事實(shí)的一種知識(shí)表示方法。簡(jiǎn)單命題的邏輯值:直接以事實(shí)為根據(jù)來(lái)判定其真假。復(fù)合命題的邏輯值:由原子命題的邏輯值以及原子命題之間的邏輯關(guān)聯(lián)共同決定。與原子命題的真值關(guān)系表真真假真真真真真假假真假假假假真真真假真假假假真假假真真157命題邏輯:推理演算等值演算:考察邏輯關(guān)系符

等值定理等值公式析取范式和合取范式推理演算:考察邏輯關(guān)系符→

基本推理公式(三段論及其證明方法)基于規(guī)則的推理演算歸結(jié)推理法158命題邏輯→謂詞邏輯一階謂詞邏輯(FOL),又稱一階邏輯、謂詞邏輯,由于其在邏輯學(xué)里的重要地位,又稱經(jīng)典邏輯。一階謂詞邏輯:在謂詞邏輯中,命題分解成謂詞和個(gè)體的組合,其中,謂詞表示個(gè)體的特性或個(gè)體間的關(guān)系。更重要的是,一階謂詞邏輯通過(guò)引入量詞,可以對(duì)個(gè)體進(jìn)行類(lèi)化。因此,一階謂詞邏輯可以建模一類(lèi)對(duì)象之間的特性之間的邏輯關(guān)系。50年代人工智能興起時(shí),McCarthy、Robinson等人就已經(jīng)開(kāi)始用FOL構(gòu)造常識(shí)推理等原型系統(tǒng)。159謂詞邏輯:基本概念個(gè)體詞:領(lǐng)域內(nèi)可以獨(dú)立存在的具體或抽象的客體。太陽(yáng)從東方升起:太陽(yáng)小王與小張同齡:小王、小張農(nóng)行是金融機(jī)構(gòu):農(nóng)行農(nóng)行與建行同屬國(guó)有:農(nóng)行、建行MATE7可以正常上網(wǎng):MATE7160謂詞邏輯:基本概念

161謂詞邏輯:基本概念

162謂詞邏輯:基本概念

163謂詞邏輯:基本概念

164謂詞邏輯:表示法謂詞邏輯:用個(gè)體、謂詞和量詞表示客觀事實(shí)的知識(shí)表示方法。用謂詞邏輯既可以表示事物的狀態(tài)、屬性、概念等事實(shí)性知識(shí)(陳述性知識(shí)),也可以表示事物間具有因果關(guān)系的規(guī)則

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論