知識工程及應(yīng)用 課件全套 第1-7章 緒論、知識獲取-基于知識的系統(tǒng)及應(yīng)用_第1頁
知識工程及應(yīng)用 課件全套 第1-7章 緒論、知識獲取-基于知識的系統(tǒng)及應(yīng)用_第2頁
知識工程及應(yīng)用 課件全套 第1-7章 緒論、知識獲取-基于知識的系統(tǒng)及應(yīng)用_第3頁
知識工程及應(yīng)用 課件全套 第1-7章 緒論、知識獲取-基于知識的系統(tǒng)及應(yīng)用_第4頁
知識工程及應(yīng)用 課件全套 第1-7章 緒論、知識獲取-基于知識的系統(tǒng)及應(yīng)用_第5頁
已閱讀5頁,還剩310頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章緒論知識及其演進知識工程及其發(fā)展主要內(nèi)容大數(shù)據(jù)環(huán)境下知識工程挑戰(zhàn)制造企業(yè)知識工程知識及其演進知識的定義《現(xiàn)代漢語調(diào)典》中的解釋:知識是人們在改造世界的實踐中所獲得的認識和經(jīng)驗的總和?!俄f伯斯特詞典》中的解釋:知識是通過實踐、研究、聯(lián)系或調(diào)查獲得的關(guān)于事物的事實和狀態(tài)的認識,是對科學、藝術(shù)或技術(shù)的理解,是人類獲得的關(guān)于真理和原理的認識的總和。知識及其演進知識的定義《中國大百科全書·教育》中的“知識”:就它反映的內(nèi)容而言,是客觀事物的屬性與聯(lián)系的反映,是客觀世界在人腦中的主觀映象。現(xiàn)代認知心理學認為:知識是存在于人的大腦皮層中有組織地呈現(xiàn)的東西,是信息在記憶中的存儲、整合和組織。知識是經(jīng)過組織的信息,是結(jié)構(gòu)化信息網(wǎng)絡(luò)或系統(tǒng)的一部分。知識及其演進知識的定義在人工智能領(lǐng)域,知識是經(jīng)過消減、塑造、解釋和轉(zhuǎn)換的信息,是信息接受者通過對信息的提煉和推理而獲得的正確結(jié)論,由特定領(lǐng)域的描述、關(guān)系和過程組成。圖書館學認為:知識不僅存在于人的大腦之中,還存在于書籍、地圖、磁帶等不斷更新的載體之中。知識是某種論域的某些方面的符號表達,是某種論域的某些方面的一種模型。知識及其演進數(shù)據(jù)、信息、知識、智能、智慧知識及其演進數(shù)據(jù)、信息、知識、智能、智慧知識及其演進知識的分類1)含義——廣義知識和狹義知識。2)作用范圍——常識性知識和領(lǐng)域性知識。3)性質(zhì)——陳述性知識和程序性知識。4)形式——隱形知識和顯性知識。5)來源——直接知識和間接知識。6)深度——感性知識與理性知識。7)屬性——物化知識與非物化知識。8)內(nèi)容——有自然、社會、思維、人文、管理、研發(fā)、生產(chǎn)等不同類別的知識。知識工程及其發(fā)展知識工程的提出1977年,美國斯坦福大學人工智能專家費根鮑姆教授(E.A.Feigenbaum)在第五屆國際人工智能會議上首次提出了“知識工程”的概念。利用自動機對知識進行獲取,不操作和利用的工程稱之為知識工程。知識工程是利用人工智能的原理和方法,對那些需要專家知識才能解決的應(yīng)用難題提供求解的手段。恰當運用專家知識的獲取、表達和推理過程的構(gòu)成與解釋是設(shè)計基于知識的系統(tǒng)的重要技術(shù)問題。知識工程及其發(fā)展知識工程的發(fā)展知識工程及其發(fā)展新一代知識工程傳統(tǒng)的知識工程面臨著的兩個主要困難:(1)知識獲取困難:隱性知識、過程知識難以表達。(2)知識應(yīng)用困難:知識表示的規(guī)模有限,難以適應(yīng)

大規(guī)模開放應(yīng)用的需求。傳統(tǒng)知識工程與知識管理、大數(shù)據(jù)相結(jié)合被稱為新一代的知識工程,是依托IT技術(shù),最大程度的實現(xiàn)信息關(guān)聯(lián)和知識關(guān)聯(lián),并把關(guān)聯(lián)的知識和信息作為企業(yè)智力資產(chǎn),以人機交互的方式進行管理和利用,在使用中提升其價值,以此促進技術(shù)創(chuàng)新和管理創(chuàng)新,提高企業(yè)核心競爭力,推動企業(yè)持續(xù)穩(wěn)定發(fā)展的全部相關(guān)活動。知識工程及其發(fā)展知識工程的研究內(nèi)容基礎(chǔ)研究:知識工程中的基礎(chǔ)理論與方法的研究,主要包括知識的獲取、知識的表示以及知識的運用和處理。實際知識系統(tǒng)的開發(fā)研究:知識工程的研究目標是構(gòu)造高性能的知識系統(tǒng),實際知識系統(tǒng)的開發(fā)研究內(nèi)容有實用知識獲取技術(shù),知識系統(tǒng)體系結(jié)構(gòu)、實用知識表示方法和知識庫結(jié)構(gòu),實用推理和解釋技術(shù),實用數(shù)據(jù)庫、知識庫管理技術(shù),知識系統(tǒng)調(diào)試、分析與評價技術(shù),知識系統(tǒng)的硬件環(huán)境等。知識工程及其發(fā)展知識工程的研究內(nèi)容知識工程環(huán)境研究:包括知識工程的基本支撐硬件和軟件、知識工程語言、知識獲取工具、系統(tǒng)骨架工具和知識庫管理工具等。企業(yè)知識工程體系建設(shè)與實施方法研究:主要包括知識群化、知識外化、知識整合、知識內(nèi)化、知識應(yīng)用和知識創(chuàng)新。在知識工程過程中,知識不斷地被群化、外化、整合和內(nèi)化,顯性知識和隱形知識在不同階段螺旋形動態(tài)轉(zhuǎn)化和上升,隨時可用于企業(yè)的各項活動和創(chuàng)新。大數(shù)據(jù)環(huán)境下知識工程挑戰(zhàn)(1)知識表示方面,如何使知識既具有顯式的語義定義,又便于大數(shù)據(jù)環(huán)境下的知識計算與推理。(2)知識獲取與融合方面,如何在知識稀疏和大數(shù)據(jù)環(huán)境下研究知識引導(dǎo)的知識獲取方法,獲得大規(guī)模和高精度的知識,碎片化知識的刻畫和融合。

(3)在知識計算和推理方面,研究深度學習和邏輯規(guī)則相結(jié)合的知識推理和演化方法,以提升新知識發(fā)現(xiàn)的能力。制造企業(yè)知識工程知識與企業(yè)能力企業(yè)信息化與企業(yè)知識化企業(yè)知識化的核心是對知識進行不斷開發(fā)、持續(xù)創(chuàng)新、高效管理和廣泛應(yīng)用,解決這一問題最有效的辦法就是全面實現(xiàn)企業(yè)管理信息化、智能化、集成化,以最快的時間、最高的性價比提供滿足用戶要求的個性化產(chǎn)品。企業(yè)核心能力來自于獨特的、異質(zhì)的、路徑依賴的、不易為外界獲取和模仿的知識體系。企業(yè)如何進行知識管理,即如何獲取、創(chuàng)造、運用知識成為企業(yè)核心能力培育的關(guān)鍵問題。制造企業(yè)知識工程企業(yè)知識管理知識工程與智能制造知識是實現(xiàn)智能的基礎(chǔ)。智能制造即把人的智能從隱性知識提煉為顯性知識,進行模型化、算法化處理,再把各種模型化的知識嵌入到物理設(shè)備中,由此而賦予機器一定的自主能力,讓機器具有一定程度的“智能”。知識管理的核心是知識,它的對象是人和組織,知識管理是在組織中構(gòu)建一個知識系統(tǒng),通過知識的獲取與積累、內(nèi)化共享、應(yīng)用的循環(huán),使人與知識緊密結(jié)合,創(chuàng)造集體智慧,從而提高創(chuàng)新能力,以幫助企業(yè)做出正確決策,應(yīng)對市場變遷。謝謝!第二章知識獲取同濟大學“智能制造工程專業(yè)聯(lián)盟”教材編委會概述數(shù)據(jù)挖掘主要內(nèi)容機器學習Web挖掘文本挖掘圖挖掘應(yīng)用案例概述第一節(jié)概述一、知識獲取的概念

二、知識獲取的來源三、知識獲取的過程四、知識獲取的主要方法五、基于神經(jīng)網(wǎng)絡(luò)的知識獲取方法概述一、知識獲取的概念

知識獲取是將某種知識源的專門知識轉(zhuǎn)換為計算機中知識采用的表示形式。這些專門知識是關(guān)于特定領(lǐng)域的特定事實、過程和判斷規(guī)則,而不包括有關(guān)領(lǐng)域的一般性知識或關(guān)于世界的常識性知識。

知識獲取是構(gòu)造知識系統(tǒng)的關(guān)鍵和主要工作,包括獲取事實和規(guī)則、從規(guī)則中演繹新的事實,精煉和維護知識,構(gòu)建知識系統(tǒng)需要的完整的、一致的知識庫。概述通常情況下,知識獲取工作的完成需要由相關(guān)專家和知識工程師(分析員)全力配合,共同完成。20世紀七八十年代的傳統(tǒng)知識工程時期所采用的知識都是由知識工程師進行手工處理的,這就要求知識工程師具有專家的知識水平,而且知識工程師常常把推理和專家知識結(jié)合到整個程序中。如今,知識系統(tǒng)通常將推理過程與知識分開,并將知識放入知識庫中。知識工程師的工作是幫助專家建立知識系統(tǒng),其重點是知識獲取。知識工程師最困難的任務(wù)是幫助專家完成知識轉(zhuǎn)換,構(gòu)建領(lǐng)域知識以及統(tǒng)一和形式化領(lǐng)域中的概念。專家也可以通過智能編輯程序?qū)⑵渲R直接轉(zhuǎn)換為可以在計算機中運行的知識。編輯程序必須具有啟發(fā)式對話的能力,并且可以將獲取的知識存儲在知識庫中。概述

為了加快知識獲取的過程,有必要選擇合適的知識獲取工具。知識獲取工具可以是簡單的程序,也可以是復(fù)雜的系統(tǒng)。簡單的知識獲取工具就是一種知識庫編輯程序,其功能如下:1)簡化知識庫的輸入并自動進行一些記錄工作。2)檢查語法以避免輸入和語法錯誤。3)保持知識庫的一致性和完整性。復(fù)雜的知識獲取工具還應(yīng)有如下功能:1)根據(jù)現(xiàn)有知識庫中的信息,協(xié)助完成知識庫的輸入和求精。2)直接同領(lǐng)域?qū)<艺归_會談并提取相關(guān)領(lǐng)域知識。3)能夠動態(tài)地檢查知識庫的一致性與完整性。4)機器學習的功能。概述二、知識獲取的來源1、在企業(yè)內(nèi)部獲取知識

(1)對現(xiàn)有的已掌握的知識進行收集整理

1)面向人的知識源來做收集工作

2)面向文獻資料的知識源來做收集工作

(2)對未來日常工作所產(chǎn)生的知識進行收集整理2、從企業(yè)內(nèi)網(wǎng)服務(wù)器挖掘文檔資料3、從外購專利庫中獲取知識4、互聯(lián)網(wǎng)上獲取知識5、從電子布告欄(BBS)中獲取知識概述三、知識獲取的過程

知識獲取的整個過程可以大致分為四個階段,這四個階段之間存在著重疊和反復(fù)。1、明確問題的性質(zhì),建立問題求解模型

此階段的目的是建立一個粗略的問題解決模。在此階段,知識工程師和領(lǐng)域?qū)<覒?yīng)密切合作,以確定問題的性質(zhì)、系統(tǒng)的作用,并梳理解決問題的專家思路。

以下問題通常在這一階段需要著重考慮:

(1)問題求解的目標及其類型;

(2)問題是如何劃分成子問題的;

(3)問題求解中涉及的主要概念及它們的關(guān)系;

(4)信息流的特征,哪些信息是由用戶提供的,哪些信息是應(yīng)當導(dǎo)出的;

(5)問題求解策略。

在此階段,知識工程師利用與領(lǐng)域?qū)<业穆?lián)系來熟悉領(lǐng)域知識并建立該領(lǐng)域的重要概念,從而為下一步工作做好準備概述2、確定知識表示形式,建立問題求解的基本框架

此階段是形式化領(lǐng)域知識的過程。在此過程中,有必要對關(guān)鍵概念、信息流特征和子問題進行形式化,并根據(jù)問題的性質(zhì)選擇合適的系統(tǒng)框架或?qū)<蚁到y(tǒng)構(gòu)建工具。形式化過程中有三個主要因素:假設(shè)空間、基本過程模型和數(shù)據(jù)表征。為了理解假設(shè)空間的結(jié)構(gòu),必須對概念進行形式化,確定它們之間的關(guān)系,并確定概念的粒度和結(jié)構(gòu)。因此應(yīng)該關(guān)注以下問題:(1)將概念描述為結(jié)構(gòu)化對象或?qū)⑵湟暈榛緦嶓w;(2)概念之間的因果關(guān)系或時空關(guān)系是否重要,是否應(yīng)明確表達,以及假設(shè)空間是否有限;(3)假設(shè)空間由預(yù)定類型組成或通過某種過程生成;(4)是否應(yīng)考慮假設(shè)的層次;(5)是否存在與最終假設(shè)和中間假設(shè)有關(guān)的不確定性或其它決定性因素;(6)是否應(yīng)考慮不同的抽象級別。概述3、實現(xiàn)知識庫,建立原型專家系統(tǒng)

在形式化階段,已經(jīng)明確了知識表示形式和問題求解策略,同時也已經(jīng)選定了系統(tǒng)框架或構(gòu)造工具,接下來便是把前一階段形式化的知識映射到選定的表示框架中。前一階段產(chǎn)生的形式化知識與選定的表示框架所要求的數(shù)據(jù)結(jié)構(gòu)、推理規(guī)則與控制策略可能有不匹配之處,這一階段要消除這些不匹配實現(xiàn)原型知識庫。如果這些不匹配不能消除,則要考慮重新選擇系統(tǒng)框架或構(gòu)造工具。4、測試與精煉知識庫這一階段的任務(wù)是通過運行實例發(fā)現(xiàn)知識庫和推理機制的缺陷。通常出現(xiàn)的導(dǎo)致性能不佳的因素有以下幾種:(1)輸入輸出特性,即數(shù)據(jù)獲取與結(jié)論表示方面存在缺陷。例如:含義模糊、提問難于理解,使得存在錯誤或不充分的數(shù)據(jù)進入系統(tǒng)。結(jié)論過多或者太少,沒有適當?shù)亟M織和排序,或者詳細的程度不適當。(2)推理規(guī)則有錯誤、不一致或不完備。(3)控制策略有問題,不是按專家采用的“自然順序”解決問題。概述

在測試過程中,實例的選擇應(yīng)考慮到所有方面,包括“典型”情況和“邊緣”情況。根據(jù)測試結(jié)果,確定是否修改原型系統(tǒng)。修改過程包括重新實現(xiàn)、重新形式化,甚至重新定義問題的性質(zhì)。測試和修改過程可以重復(fù)進行,直到系統(tǒng)達到令人滿意的性能,這一過程被稱為求精。求精過程可大致分為五個步驟,如下圖所示。概述四、知識獲取的主要方法

知識獲取是知識工程師和領(lǐng)域?qū)<夜餐献鞯倪^程,可以分為交互式和非交互式知識獲取過程。交互式(也稱為主動式)是當知識工程師提出詢問時,領(lǐng)域?qū)<一卮穑诮换ブ蝎@取領(lǐng)域知識。非交互式(也稱為被動式)中知識工程師不會干擾領(lǐng)域?qū)<业墓ぷ?,而是以觀察方式獲取領(lǐng)域知識。這種獲取知識的方式比交互式更難,但在某些情況下只能用這種方式完成。以下是知識獲取的一些主要方法。

1、面談法

2、模擬法

3、口語記錄分析

4、多維度量法

5、概念分類法

上述每種方法都有其自身的特點,但也有其局限性。由于人類專家知識的多樣性和復(fù)雜性,經(jīng)常需要采用多種不同的方法來提取專家知識。概述五、基于神經(jīng)網(wǎng)絡(luò)的知識獲取方法

常用的實現(xiàn)知識自動獲取的方法是基于神經(jīng)網(wǎng)絡(luò)的知識獲取方法,該方法能夠有效解決專家系統(tǒng)的知識獲取瓶頸問題。人工神經(jīng)網(wǎng)絡(luò)是一種具有自組織、自學習和自適應(yīng)特點的大規(guī)模信息并行處理系統(tǒng),能夠在智能系統(tǒng)中很好地自動獲取知識,即通過實例學習獲取知識,基于神經(jīng)網(wǎng)絡(luò)的知識求精以及從神經(jīng)網(wǎng)絡(luò)提取規(guī)則知識。1、通過學習獲取知識

神經(jīng)網(wǎng)絡(luò)通過學習訓練實現(xiàn)知識獲取。學習過程是先根據(jù)應(yīng)用問題選擇神經(jīng)網(wǎng)絡(luò)的模型和結(jié)構(gòu),再選擇學習算法,對求解問題有關(guān)的樣本進行學習,通過學習調(diào)整神經(jīng)網(wǎng)絡(luò)的聯(lián)接權(quán)值,完成知識的自動獲取。

目前,知識獲取最常用的神經(jīng)網(wǎng)絡(luò)是采用BP算法的多層前饋神經(jīng)網(wǎng)絡(luò),它由輸入層、隱含層和輸出層構(gòu)成。其中隱含層可以有一層或多層,相鄰層的神經(jīng)元之間相互連接,但同一層的神經(jīng)元之間不相互連接。輸入信號從輸入層向前傳播到輸出層,成為輸出信號,這種神經(jīng)網(wǎng)絡(luò)也常被稱為BP神經(jīng)網(wǎng)絡(luò)。概述概述2、基于神經(jīng)網(wǎng)絡(luò)的知識求精

知識求精是知識獲取不可缺少的一步。通常情況下,得到的初始知識庫常常存在一些問題,比如知識不完全、知識之間不一致、有的知識不正確等,因此需要對初始知識庫調(diào)試、修改與補充。

基于神經(jīng)網(wǎng)絡(luò)的知識求精方法的流程如圖2-3所示,圖中的初始規(guī)則集即初始知識庫,訓練樣本即專家例證,由3個步驟組成:第1步:將初始規(guī)則集轉(zhuǎn)化為初始神經(jīng)網(wǎng)絡(luò)。第2步:用訓練樣本和學習算法訓練初始神經(jīng)網(wǎng)絡(luò),也就是知識的求精過程。第3步:提取求精后的規(guī)則知識。概述3、從神經(jīng)網(wǎng)絡(luò)中提取規(guī)則

通過神經(jīng)網(wǎng)絡(luò)獲取的知識是分布式的、隱式的、難于理解的,因此從神經(jīng)網(wǎng)絡(luò)提取規(guī)則十分重要,下面介紹一種用神經(jīng)網(wǎng)絡(luò)來獲取規(guī)則知識的典型方法。首先用如圖2-4

所示的三層BP神經(jīng)網(wǎng)絡(luò)來學習訓練樣本,并用公式(2-1)獲取輸出節(jié)點b和輸入節(jié)點a之間的邏輯相關(guān)程度度量(越小,a和b之間相關(guān)程度越大)

式中,是原始輸入節(jié)點a和隱含層節(jié)點j之間的連接權(quán)值,是附加輸入節(jié)點b(對應(yīng)于某個輸出節(jié)點)和隱含層節(jié)點j之間的連接權(quán)值。

然后用一個如圖2-5所示的單層神經(jīng)網(wǎng)絡(luò)對樣本進行學習,獲取輸出節(jié)點b與輸入節(jié)點a之間的邏輯不相關(guān)(無關(guān))程度度量Weightab;最后將Weightab和SSEab的乘積Productab作為a和b之間的因果關(guān)系度量。若Productab接近于0,則a是b的邏輯前提,將b的所有邏輯前提(ai)進行“邏輯與”,得到如下的邏輯規(guī)則:概述數(shù)據(jù)挖掘第二節(jié)數(shù)據(jù)挖掘一、

數(shù)據(jù)挖掘概述

二、

數(shù)據(jù)挖掘的構(gòu)成和分類

三、

數(shù)據(jù)挖掘的方法四、

數(shù)據(jù)挖掘的過程五、

數(shù)據(jù)挖掘的發(fā)展數(shù)據(jù)挖掘一、數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘起源于知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD),是知識發(fā)現(xiàn)的一個關(guān)鍵步驟。1989年8月,GregoryI.Piatetsky-Shapiro等人在美國底特律的國際人工智能聯(lián)合會議首次提出知識發(fā)現(xiàn)和數(shù)據(jù)挖掘的概念。知識發(fā)現(xiàn)的過程是一種以知識用戶為中心的人機交互探索過程,通過從數(shù)據(jù)中識別有效的、潛在有用的、最終可理解的模式。它包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)過濾、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、模式評估、知識表示和其他處理過程。每個步驟相互影響并形成一個螺旋上升的過程。數(shù)據(jù)挖掘是知識發(fā)現(xiàn)最重要的一步。有時可以不加選擇地使用知識發(fā)現(xiàn)和數(shù)據(jù)挖掘。數(shù)據(jù)挖掘數(shù)據(jù)挖掘二、數(shù)據(jù)挖掘的構(gòu)成和分類一個典型的數(shù)據(jù)挖掘系統(tǒng)由以下主要部分組成:(1)數(shù)據(jù)倉庫或其他信息庫:這是一個或一組數(shù)據(jù)庫、數(shù)據(jù)倉庫、展開的表或其他類型的信息庫,可以在數(shù)據(jù)上進行數(shù)據(jù)清理或集成。(2)數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器:根據(jù)用戶的數(shù)據(jù)挖掘請求數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器負責提取相關(guān)數(shù)據(jù)。(3)知識庫:領(lǐng)域知識,用于指導(dǎo)搜索或評估結(jié)果模式的興趣度。(4)數(shù)據(jù)挖掘引擎:這是數(shù)據(jù)挖掘系統(tǒng)最基本的部分,由一組功能模塊組成,用于特征、關(guān)聯(lián)、分類、聚類、演變和偏差分析。(5)模式評估:該部分通常使用興趣度度量,并與數(shù)據(jù)挖掘模塊交互,以便將搜索聚焦在有趣的模式上,它是使用興趣度閾值過濾發(fā)現(xiàn)的模式。(6)圖形用戶接口:該模塊使用戶和挖掘系統(tǒng)對接,允許用戶與系統(tǒng)進行交互,制定數(shù)據(jù)挖掘查詢或搜索聚焦,根據(jù)數(shù)據(jù)挖掘的中間結(jié)果進行探索式數(shù)據(jù)挖掘。此外,該成分還允許用戶瀏覽數(shù)據(jù)庫和數(shù)據(jù)倉庫模式或數(shù)據(jù)結(jié)構(gòu),評估挖掘的模式,以不同的形式對模式進行可視化處理。數(shù)據(jù)挖掘三、數(shù)據(jù)挖掘的方法

利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析常用的方法或關(guān)鍵技術(shù)主要有:關(guān)聯(lián)分析、時序模式、聚類、分類、偏差檢測和預(yù)測等6項,它們分別從不同的角度對數(shù)據(jù)進行挖掘,用于描述對象內(nèi)涵、概括對象特征、發(fā)現(xiàn)數(shù)據(jù)規(guī)律、檢測異常數(shù)據(jù)等。1、關(guān)聯(lián)分析關(guān)聯(lián)分析是從數(shù)據(jù)庫中發(fā)現(xiàn)知識的一種重要方法。若兩個或多個數(shù)據(jù)項的取值之間重復(fù)出現(xiàn)且概率很高時,那么就可以斷定它們之間存在著某種關(guān)聯(lián),因而可以建立起這些數(shù)據(jù)項的關(guān)聯(lián)規(guī)則。2、時序模式通過時間序列發(fā)現(xiàn)具有高重復(fù)概率的模式,并在此強調(diào)時間序列的影響。在時序模式下,有必要找出一個規(guī)則,即在一定的最短時間內(nèi)該比率始終高于一定的最小百分比(閾值)。數(shù)據(jù)挖掘4、分類

分類在數(shù)據(jù)挖掘中使用最廣泛。在聚類的基礎(chǔ)上,分類是找出所確定類的概念描述,該類描述表示此類數(shù)據(jù)的整體信息。通常,它由規(guī)則或決策樹模式表示,可以將數(shù)據(jù)庫中的元組映射到給定類別。5、偏差檢測

數(shù)據(jù)庫中可能存在很多異常情況,因此找到這些異常情況以引起人們的注意也很重要。偏差包括以下內(nèi)容:分類異常示例、模式異常、觀測結(jié)果與模型預(yù)測的偏差、量值隨時間變化。6、預(yù)測預(yù)測是使用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并使用該模型預(yù)測未來數(shù)據(jù)的類型和特征的手段。3、聚類

數(shù)據(jù)庫中的數(shù)據(jù)可以根據(jù)其內(nèi)部的距離關(guān)系劃分為一系列有意義的子集,即類。簡而言之,就是在原本沒有劃分類別的數(shù)據(jù)集中,根據(jù)其內(nèi)容的“距離”的概念集成了多個類別。在同一類別中,個體之間的距離較小,而在不同類別中的個體之間的距離較大。數(shù)據(jù)挖掘四、數(shù)據(jù)挖掘的過程一般來說,數(shù)據(jù)挖掘過程有五個步驟:確定挖掘目的、數(shù)據(jù)準備、進行數(shù)據(jù)挖掘、結(jié)果分析、知識的同化。圖2-7

數(shù)據(jù)挖掘過程有五個步驟數(shù)據(jù)挖掘五、數(shù)據(jù)挖掘的發(fā)展目前,對KDD的研究主要圍繞理論、技術(shù)和應(yīng)用這三個方面展開。多種理論與方法的合理整合是大多數(shù)研究者采用的有效技術(shù)。

21世紀以來國內(nèi)外數(shù)據(jù)挖掘的新發(fā)展主要是對發(fā)現(xiàn)知識的方法的進一步研究,如近年來注重對Bayes(貝葉斯)方法以及Boosting方法的研究和改進提高;KDD與數(shù)據(jù)庫的緊密結(jié)合;傳統(tǒng)的統(tǒng)計學回歸方法在KDD中的應(yīng)用;對海量數(shù)據(jù)的處理;將粗糙集和模糊集理論融合用于知識發(fā)現(xiàn);以及研究中文文本挖掘的理論模型與實現(xiàn)技術(shù)等。

在應(yīng)用構(gòu)造智能專家系統(tǒng)方面主要體現(xiàn)在KDD商業(yè)軟件工具從解決問題的孤立過程轉(zhuǎn)向建立解決問題的整體系統(tǒng),主要用戶有保險公司、大型銀行和銷售業(yè)等。許多計算機公司和研究機構(gòu)都非常重視數(shù)據(jù)挖掘的開發(fā)應(yīng)用,IBM和微軟都相繼成立了相應(yīng)的研究中心。使用數(shù)據(jù)挖掘技術(shù)解決大型或者復(fù)雜的應(yīng)用問題是數(shù)據(jù)挖掘研究領(lǐng)域重要的任務(wù)。機器學習第三節(jié)機器學習一、

機器學習概述二、

機器學習的發(fā)展三、

機器學習的方法四、

機器學習的過程五、

機器學習在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用機器學習一、機器學習概述

機器學習(MachineLearning)是一種研究學習的理論,其通過計算機模型,模擬或?qū)崿F(xiàn)人類的學習行為,給予計算機學習能力,進而獲取新的知識或技能,或者重新組織已有的知識結(jié)構(gòu),使之不斷改善自身性能的過程、原理和方法。機器學習是人工智能的研究核心,是計算機具有智能的重要標志。機器學習也是一種知識獲取手段,由計算機取代部分知識工程師和領(lǐng)域?qū)<业墓ぷ鳌?/p>

人們研究機器學習的目的主要是希望理論上能夠從認知科學的角度研究人類學習的機理,工程上開發(fā)具有學習能力的計算機系統(tǒng)。二、機器學習的發(fā)展數(shù)值表示和參數(shù)調(diào)整概念學習和語言獲取歸納學習、類比學習等神經(jīng)網(wǎng)絡(luò)知識發(fā)現(xiàn)和數(shù)據(jù)挖掘20世紀50年代中期20世紀60年代初期20世紀70年代中后期20世紀80年代中后期21世紀初期機器學習三、機器學習的方法

與人類有著多種多樣的學習方法一樣,機器學習也有很多方法。根據(jù)機器學習所采用的學習策略、知識表示方法及其應(yīng)用領(lǐng)域,可把機器學習方法劃分為6類:1、機械學習(rotelearning)2、通過采納建議學習(learningbyadvicetaking)3、通過例子學習((learningfromexamples)4、通過類比學習(learningbyanalogy)5、基于解釋的學習(explanation-basedlearning)6、通過觀察學習((learningfromobservationanddiscovery)機器學習四、機器學習的過程機器學習系統(tǒng)的一般結(jié)構(gòu)。機器學習五、機器學習在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用

在大數(shù)據(jù)環(huán)境中,機器學習算法的設(shè)計與實現(xiàn)涉及很多方面,包括分布式計算,數(shù)據(jù)流技術(shù),云技術(shù)等。結(jié)合這些技術(shù),機器學習算法可以有效地處理數(shù)億個數(shù)據(jù)對象,并快速訓練模型,從而獲得有價值的知識。機器學習技術(shù)已廣泛用于企業(yè)數(shù)據(jù)挖掘中,例如推薦系統(tǒng)、智能語音識別、搜索引擎等。大數(shù)據(jù)的發(fā)展,關(guān)鍵技術(shù)和評估指標的開發(fā)與研究對機器學習方法的研究工作提出了新的挑戰(zhàn)和要求。

當前,大數(shù)據(jù)技術(shù)已廣泛應(yīng)用于電信、金融和醫(yī)療保健等許多行業(yè)和領(lǐng)域。在實際應(yīng)用中如何從高維、稀疏、異構(gòu)和動態(tài)的大數(shù)據(jù)中獲取模式,迫切需要深層機器學習的理論和技術(shù)來進行指導(dǎo)。由此,可以預(yù)見,以下幾個領(lǐng)域必然會受到未來的機器學習研究的關(guān)注:(1)超高維數(shù)據(jù)采樣和特征提取。(2)借助Hadoop和Spark等分布式計算平臺設(shè)計和實現(xiàn)分布式機器學習算法。(3)研究機器學習算法的泛化能力,執(zhí)行效率和可理解性。Web挖掘第四節(jié)Web挖掘一、

Web挖掘概述二、

Web挖掘的分類三、

Web挖掘的過程四、

Web挖掘技術(shù)的應(yīng)用Web挖掘一、Web挖掘概述

隨著Internet/Web技術(shù)的快速普及和發(fā)展,如何在這個全球最大的數(shù)據(jù)集合中發(fā)現(xiàn)有用信息,成為數(shù)據(jù)挖掘研究的熱點,由此產(chǎn)生了Web挖掘。Web挖掘是指通過數(shù)據(jù)技術(shù)在萬維網(wǎng)(WWW)數(shù)據(jù)中發(fā)現(xiàn)潛在和有用的模式或信息。Web挖掘研究涵蓋了許多研究領(lǐng)域,包括數(shù)據(jù)庫技術(shù)、信息獲取技術(shù)、統(tǒng)計、機器學習和神經(jīng)網(wǎng)絡(luò)等。與傳統(tǒng)的數(shù)據(jù)和數(shù)據(jù)倉庫不同,Web上的信息是半結(jié)構(gòu)化或非結(jié)構(gòu)化的,并且是動態(tài)的,易于混淆。它必須經(jīng)過必要的數(shù)據(jù)處理,否則很難直接從網(wǎng)頁上進行數(shù)據(jù)挖掘。二、Web挖掘的分類

根據(jù)在挖掘過程中使用的數(shù)據(jù)類別不同,Web挖掘通??梢员环殖扇缦氯N類別:Web內(nèi)容挖掘、Web用法挖掘、Web結(jié)構(gòu)挖掘。

Web內(nèi)容挖掘是一個從Web內(nèi)容、數(shù)據(jù)、文檔中獲取潛在的、有價值的知識或模式的過程。Web用法挖掘是挖掘用戶訪問時Web在服務(wù)器留下的訪問記錄,挖掘的對象是保留在服務(wù)器上的日志信息,也稱Web訪問信息挖掘。Web結(jié)構(gòu)挖掘是從WWW的組織結(jié)構(gòu)和鏈接關(guān)系中獲取知識,主要通過對網(wǎng)站結(jié)構(gòu)的分析、變形和歸納,對網(wǎng)頁進行分類,以方便信息搜索。Web挖掘三、Web挖掘的過程

1.查找資源:從目標Web文檔中得到數(shù)據(jù),除了在線Web文檔,還包括電子郵件、電子文檔新聞組以及網(wǎng)站的日志數(shù)據(jù),甚至是通過Web形成的交易數(shù)據(jù)庫中的數(shù)據(jù)。

2.信息選擇和預(yù)處理:從取得的Web資源中剔除無用信息,并對信息進行必要的整理。例如,從Web文檔中自動去除廣告鏈接,去除多余格式標記、自動識別段落或字段并將數(shù)據(jù)組織成規(guī)整的邏輯形式甚至是關(guān)系表。

3.模式發(fā)現(xiàn):在同一個站點內(nèi)部或在多個站點之間自動進行模式發(fā)現(xiàn)。

4.模式分析:驗證、解釋上一步驟產(chǎn)生的模式。該任務(wù)可以是機器自動完成,也可以是與分析人員進行交互完成Web挖掘四、Web挖掘技術(shù)的應(yīng)用當前,Web數(shù)據(jù)挖掘的研究重點已從理論轉(zhuǎn)向應(yīng)用,Web數(shù)據(jù)挖掘在以下實際生活領(lǐng)域被普及:(1)電子商務(wù)(2)網(wǎng)頁搜索(3)知識定向服務(wù)(4)政府部門文本挖掘第五節(jié)文本挖掘一、

文本挖掘的概述二、

文本挖掘的發(fā)展三、

文本挖掘的方法四、

文本挖掘的過程五、

文本挖掘的研究與應(yīng)用文本挖掘一、文本挖掘的概述

文本挖掘是指從文本文件中提取有價值的知識,并利用它更好的組織信息的過程。通過使用基于案例的推理,可能性理解和其他神經(jīng)網(wǎng)絡(luò)智能算法,并結(jié)合文字處理技術(shù),通過分析大量非結(jié)構(gòu)化文本源(例如文檔、電子表格、客戶電子郵件、網(wǎng)頁等),提取或標記關(guān)鍵字的概念以及文字之間的關(guān)系,根據(jù)內(nèi)容對文檔進行分類,從而發(fā)現(xiàn)和提取隱藏的未知知識,最終形成用戶可以理解的有價值的信息和知識。文本挖掘是知識獲取的一個分支,是人工智能研究領(lǐng)域中自然語言理解和計算機語言學的結(jié)合用于基于文本信息的知識發(fā)現(xiàn),是一個跨學科領(lǐng)域,涉及許多技術(shù),例如數(shù)據(jù)挖掘、信息檢索、機器學習、自然語言處理、計算語言學、統(tǒng)計數(shù)據(jù)分析、線性幾何、概率論和圖論等。二、文本挖掘的發(fā)展

文本挖掘的產(chǎn)生主要是人們發(fā)現(xiàn)傳統(tǒng)的信息檢索技術(shù)不能滿足海量數(shù)據(jù)的處理需求。特別是隨著互聯(lián)網(wǎng)時代的到來,用戶可以獲得大量的非結(jié)構(gòu)化文本數(shù)據(jù),包括技術(shù)數(shù)據(jù)、業(yè)務(wù)信息、新聞報道、娛樂信息和其他類別的文檔,這些數(shù)據(jù)構(gòu)成了一個巨大的異構(gòu)開放的分布式數(shù)據(jù)庫。文本挖掘三、文本挖掘的方法

目前,對于自然語言處理的方法主要包含三類:基于語言學和人工智能的方法、基于語料庫和統(tǒng)計語言模型的方法、混合的方法。第一種方法是一種理性主義方法,又稱為基于規(guī)則的方法;第二種方法是一種經(jīng)驗主義方法,又稱為基于統(tǒng)計的方法;混合的方法是指理想主義方法和經(jīng)驗主義方法的有機結(jié)合。從語句分析的角度講,文本知識獲取的方法主要有兩種:基于語句分析的方法和基于語境的方法。文本分析法首先對文本進行詞性標注,然后將出現(xiàn)頻率高的詞語識別為領(lǐng)域概念,最后人工驗證概念以及人工標注。從學習的角度講,文本知識獲取方法主要有機器學習方法和基于記憶的方法。采用的機器學習算法主要有:關(guān)聯(lián)學習算法和自底向上學習算法。四、文本挖掘的過程文本挖掘處理主要經(jīng)過三個階段:文檔預(yù)處理、特征信息提取和數(shù)據(jù)挖掘。文本挖掘五、文本挖掘的研究與應(yīng)用

拉丁語系國家的研究人員最早展開了對文本挖掘的研究。他們的研究主要包括了諸如文本的表示方法以及對相關(guān)模型的建立;結(jié)合自然語言理解領(lǐng)域的基礎(chǔ)進行更深層次語義挖掘的相關(guān)研究;針對文本數(shù)據(jù)高維性問題的特征提取以及降維方法的研究;針對目標特點選擇不同類型的挖掘算法,來解決文本的分類、聚類問題;結(jié)合不同領(lǐng)域的文本挖掘的應(yīng)用,如應(yīng)用在金融證券領(lǐng)域的股票預(yù)測、科學研究領(lǐng)域文獻的挖掘以及Internet上的主題檢測、Web挖掘、自動問答等。目前使用比較廣泛的文本挖掘系統(tǒng)有KDT、IBMBusinessIntelligence、TextVis等。

國內(nèi)的文本挖掘研究除緊跟國際前沿外,有相當一部分研究集中在如何充分利用中文文本特點進行更好的文本挖掘上。圍繞中文文本的處理,特別是結(jié)合自然語言理解技術(shù),找到適合中文文本的快速高效方法從而更好地設(shè)計和開發(fā)中文文本挖掘應(yīng)用。中國知網(wǎng)的學位論文學術(shù)不端行為檢測系統(tǒng),拓爾思的文本檢索系統(tǒng)TRS,香港科技大學的中文自動問答系統(tǒng)等都是針對不同目標實施的不同的文本挖掘應(yīng)用實例。圖挖掘第六節(jié)圖挖掘一、

圖挖掘概述二、

圖挖掘的主要內(nèi)容三、

圖挖掘的應(yīng)用四、

圖挖掘的發(fā)展圖挖掘一、圖挖掘概述1、圖挖掘的概念

圖挖掘(GraphMining)是指利用圖模型從海量數(shù)據(jù)中發(fā)現(xiàn)和提取有用知識和信息的過程。圖挖掘已廣泛應(yīng)用于商務(wù)管理、市場分析、生產(chǎn)控制、科學探索和工程設(shè)計等領(lǐng)域。圖挖掘所涉及的領(lǐng)域主要是圖的聚類、圖的分類和頻繁子圖(子結(jié)構(gòu))挖掘等,其中頻繁子圖挖掘的目的是找到在圖集中頻繁出現(xiàn)的子圖集模式。2、圖數(shù)據(jù)的定義

圖是最常用的數(shù)據(jù)結(jié)構(gòu)之一,能夠描述事物之間錯綜復(fù)雜的關(guān)系。圖是由若干節(jié)點和連接點與點之間的邊所構(gòu)成的結(jié)構(gòu),用于描述節(jié)點對象之間的特定關(guān)系,每一個節(jié)點代表一個對象,用邊來表示節(jié)點之間的確定關(guān)系。各節(jié)點的位置可以變化,而且點與點之間的連線也可以為任意距離,并沒有長短之分,具有拓撲性質(zhì)。在圖論中,網(wǎng)絡(luò)是頂點和邊的集合,通常用G=(V,E)表示,V表頂點,E表示邊。頂點代表現(xiàn)實世界中的各類實體,兩點的之間的邊表示兩個實體的關(guān)聯(lián)關(guān)系。作為一種常見的數(shù)據(jù)結(jié)構(gòu),采用圖論知識來描述各類實體間的數(shù)據(jù)關(guān)系,形式上更生動準確易于理解。圖挖掘

邊的存在可能性為1表示邊一定存在。因此,確定圖(定義2.1)可以看作所有邊的存在可能性皆為1的特殊的不確定圖。不確定圖模型圖挖掘右圖表明了圖同構(gòu)與子圖同構(gòu)的不同。其中,圖(b)、圖(a)同構(gòu),圖(c)、(a)子圖同構(gòu)圖。圖同構(gòu)與子圖同構(gòu)圖挖掘二、圖挖掘的主要內(nèi)容1、圖的匹配2、圖數(shù)據(jù)關(guān)鍵字查詢3、頻繁子圖挖掘4、圖的聚類5、圖的分類三、圖挖掘的應(yīng)用1、社交網(wǎng)絡(luò)2、隱私保護3、軟件缺陷定位4、生物網(wǎng)絡(luò)5、Web挖掘圖挖掘四、圖挖掘的發(fā)展

近年來,越來越多的圖數(shù)據(jù)結(jié)構(gòu)在我們的日常生活中出現(xiàn),例如社交網(wǎng)絡(luò)、生物信息學領(lǐng)域、Web應(yīng)用等,這對圖數(shù)據(jù)挖掘提出了更多的新要求:(1)如何有效、高效管理大量的圖數(shù)據(jù)(圖數(shù)據(jù)庫);(2)如何針對現(xiàn)實的數(shù)據(jù)利用圖結(jié)構(gòu)進行建模;(3)如何從圖數(shù)據(jù)中挖掘出感興趣的模式,如頻繁模式、顯露模式等。同時,在過去的數(shù)年中,圖數(shù)據(jù)挖掘的相關(guān)論文在數(shù)據(jù)挖掘領(lǐng)域的主流會議,如ICDM、SigKDD、SiamDM等中有逐年遞增的趨勢;圍繞圖挖掘的主題展開的Workshop越來越多,包括有關(guān)鏈接分析和群組檢測、多維數(shù)據(jù)挖掘的KDDWorkshop以及有關(guān)圖、樹、序列挖掘的EuropeanWorkshop。同時,越來越多的國內(nèi)外重要期刊明確提出對有關(guān)圖挖掘方面的文章的征集。應(yīng)用案例第七節(jié)應(yīng)用案例案例一、知識獲取在制造業(yè)的應(yīng)用:數(shù)控機床ICAID系統(tǒng)數(shù)控機床ICAID系統(tǒng)是面向機床行業(yè)提供的一種基于知識的工業(yè)設(shè)計解決方案,系統(tǒng)的使用者是機床的設(shè)計主體,包括工業(yè)設(shè)計師與機床工程師。其目的是針對裝備制造關(guān)鍵共性技術(shù)-工業(yè)設(shè)計技術(shù),進行研究、應(yīng)用,發(fā)揮提升產(chǎn)品質(zhì)量的作用,解決機床行業(yè)和制造業(yè)的設(shè)計問題。該系統(tǒng)以基于因特網(wǎng)的計算機輔助工業(yè)設(shè)計概念(InternetbasedcomputeraidedindustrialdesignICAID)為原型和研究基礎(chǔ),通過引入基于網(wǎng)絡(luò)的設(shè)計和基于知識的設(shè)計等理念和技術(shù),在網(wǎng)絡(luò)環(huán)境下建立一個工業(yè)設(shè)計師和機床工程師共同參與的、由知識驅(qū)動的計算機輔助工業(yè)設(shè)計系統(tǒng),系統(tǒng)的建立依賴于知識的收集和獲取。應(yīng)用案例有研究表明,對于典型數(shù)控車床和立式加工中心的設(shè)計,工程師習慣在造型設(shè)計時以側(cè)視圖和側(cè)面輪廓為起點,先勾畫出合理的側(cè)面形式,再進行正面和其他部件的設(shè)計。這種由側(cè)視圖入手的設(shè)計思路比較合適小型立式加工中心這種側(cè)面造型特征明顯而正面形式較簡單的情況,可作為在造型設(shè)計初期產(chǎn)生機床產(chǎn)品基本形式和各種變形可能的入口,并應(yīng)用到輔助設(shè)計系統(tǒng)中去。

基于這一發(fā)現(xiàn),結(jié)合Flash軟件和Web交互技術(shù),可針對數(shù)控車床類產(chǎn)品設(shè)計一個基于機床工業(yè)設(shè)計實際經(jīng)驗的側(cè)面輪廓草圖繪制和三維概念生成的原型系統(tǒng)。將側(cè)面輪廓定義為由若干關(guān)鍵節(jié)點組成的連接線,并事先預(yù)設(shè)若干個關(guān)鍵造型控制點。設(shè)計者通過自由拉伸這些控制點的位置,調(diào)節(jié)曲率等參數(shù)來達到自己預(yù)想的輪廓效果,然后模擬出立體的設(shè)計效果,并進行適當?shù)娜藱C關(guān)系分析。

在試驗中,設(shè)計者結(jié)合多年機床造型設(shè)計的經(jīng)驗,根據(jù)機床種類和結(jié)構(gòu)布局的特點,提取出了數(shù)控車床的8種典型側(cè)面輪廓形式,并設(shè)計開發(fā)了針對數(shù)控車床的側(cè)面輪廓草圖設(shè)計與查詢系統(tǒng)。設(shè)計者可將確認的側(cè)面輪廓拉伸成有立體效果的機床形體,并和實際比例的人體模板(參照《中國成年人人體尺寸》)進行人機尺度分析等有關(guān)使用者要素的比較性分析研究,作為門、窗和把手等的位置以及大小的設(shè)計依據(jù)等。應(yīng)用案例系統(tǒng)測試本身也是一個獲取設(shè)計知識和應(yīng)用知識的過程,可以看成是一種知識獲取的有效方法。以系統(tǒng)設(shè)計中的專家樣本為研究對象,建立對這類問題較科學的研究體系,并從試驗分析中進行知識的提取和建模,是建立知識系統(tǒng)的基礎(chǔ)。ICAID系統(tǒng)(Http://)建立了有2000個方案的造型設(shè)計圖庫,并以其為基本設(shè)計工具進行了大量數(shù)控機床產(chǎn)品的實際設(shè)計,其中有以側(cè)面輪廓入手完成的南京數(shù)控機床公司CK1480型數(shù)控車床的外觀造型設(shè)計,該產(chǎn)品在2003北京國際機床展上展出,驗證了這種表達造型設(shè)計知識的方式和設(shè)計思路的可行性。在系統(tǒng)測試中還發(fā)現(xiàn),機床工程師對其獨立設(shè)計的外形方案很難有完全的把握,在一些關(guān)鍵環(huán)節(jié)還希望得到有經(jīng)驗的工業(yè)設(shè)計師對色彩搭配、尺寸和造型比例等方面的幫助和指導(dǎo)。這再次體現(xiàn)了建立設(shè)計知識應(yīng)用系統(tǒng)的必要性,也說明有效的設(shè)計評價也是造型設(shè)計過程的一個必不可少的重要階段。由于方案的設(shè)計和評價過程存在不同的心理衡量標準,因此設(shè)計過程使用的設(shè)計知識系統(tǒng)和評價過程的決策知識系統(tǒng)應(yīng)該有所不同。應(yīng)用案例案例二、圖挖掘在零件加工特征識別中的應(yīng)用零件加工特征識別是從零件CAD模型中獲得具有一定加工意義的幾何形體,是CAD/CAPP集成的基礎(chǔ),是工藝數(shù)字化的關(guān)鍵。基于圖的模式匹配法是加工特征識別常用的方法之一。構(gòu)建零件屬性鄰接圖(AAG圖),通過分解生成最小屬性鄰接圖MAAG集合,與預(yù)定義的加工特征基本單元的AAG匹配,在此基礎(chǔ)上進行聚類,可完成零件基本加工特征和復(fù)合加工特征的識別。謝謝!第三章知識表示

同濟大學“智能制造工程專業(yè)聯(lián)盟”教材編委會第一節(jié)概述第二節(jié)一階謂詞邏輯表示法目錄第三節(jié)框架表示法第四節(jié)語義網(wǎng)絡(luò)第五節(jié)產(chǎn)生式表示法第六節(jié)過程表示法第七節(jié)狀態(tài)空間表示法第八節(jié)面向?qū)ο蟊硎痉ǖ诰殴?jié)基于范例表示法目錄第十節(jié)基于ROUGHSET表示法第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示第十二節(jié)基于本體的知識表示法第十三節(jié)知識圖譜中的知識表示第一節(jié)概述一、知識表示的含義利用計算機能夠接受并進行處理的符號和方式,來表示人類在改造客觀世界中所獲得的知識。二、知識表示的準則完整表示領(lǐng)域知識助力知識推理便于知識的管理與維護便于知識的理解和實現(xiàn)第一節(jié)概述三、知識表示的發(fā)展簡史20世紀60年代中期,開始作為一個獨立的研究課題20世紀60年代后期,專注于語義網(wǎng)絡(luò)表示模式20世紀70年代語義網(wǎng)絡(luò)、一階謂詞邏輯、框架和產(chǎn)生式系統(tǒng)等重要表示方法的出現(xiàn),標志著知識表示成為一個獨立研究的領(lǐng)域,并且在不斷的發(fā)展中。第二節(jié)一階謂詞邏輯表示法一、謂詞邏輯表示規(guī)則基本組成部分:謂詞符號、變量符號、函數(shù)符號和常量,并用圓括號、方括號、花括號和逗號隔開,以表示論域內(nèi)的關(guān)系。例如:“張三是學生”,用最簡單的原子公式:Student(張三)。Student是謂詞符號,張三是常量。某學生在某房間:

Inroom[Student(x),Room(y)]

Inroom,Student,Room謂詞符號x,y變量符號第二節(jié)一階謂詞邏輯表示法一、謂詞邏輯表示規(guī)則用聯(lián)詞(與)、(或)以及→(蘊涵,或隱含)等,組合多個原子公式構(gòu)成比較復(fù)雜的合式公式。例如:“張三和李四”可寫成:

Student(張三)Student(李四)學生李四住在一幢黃色的房子里:Lives[Student(李四),House(x)]Color[House(x),Yellow]如果該書是張三的,那么它是藍色(封面)的:

Owns[Student(張三),Book-1]→Color(Book-1,Blue)第二節(jié)一階謂詞邏輯表示法二、謂詞邏輯表示的演算

兩個合式公式的計算表PQP

QP

QP

Q?PTTTTTFFTTFTTTFTFFFFFFFTT第三節(jié)

框架表示法一、框架理論1975年Minsky提出的,作為理解視覺、自然語言對話和其它復(fù)雜行為的基礎(chǔ)一個框架可以形式地表示如下:FRAME<框架名>

槽名1:側(cè)面名11:側(cè)面值11

側(cè)面名12:側(cè)面值12……

側(cè)面名1m:側(cè)面值1m……

槽名n:側(cè)面名n1:側(cè)面值n1

側(cè)面名n2:側(cè)面值n2……

側(cè)面名np:側(cè)面值np第三節(jié)

框架表示法一、框架理論舉例一個飯店框架

框架名:<飯店>種類:是否含住宿:<是,否>類別:<自助餐廳,商務(wù)餐廳,快餐,其他>地址:營業(yè)時間:缺省值<10:00-22:00>場所大?。ㄆ椒矫祝喝司M(元):食品風味:地域特色:<中式,美式,法式,意大利風味,日式,韓國料理,其他>缺省值<中式>菜系:<魯菜,川菜,粵菜,蘇菜,閩菜,浙菜,湘菜,徽菜>缺省值<浙菜>特色菜:<片皮鴨、紅燒肉、黑椒牛肉、……>相關(guān)服務(wù):是否提供停車服務(wù):<是,否>

是否提供預(yù)訂服務(wù):<是,否>第三節(jié)框架表示法二、框架的性質(zhì)及特點描述事物時,如果進一步描述其中某細節(jié),那么可以擴充為額外一些框架。能夠借助框架作出判斷能夠借助框架來了解一些事物能夠通過一系列的實例來修正框架對某些事物的不完整描述重要性質(zhì)表現(xiàn)在:能夠預(yù)測相關(guān)信息第三節(jié)框架表示法二、框架的性質(zhì)及特點可以描述類型的含義、事件和行為,是一種經(jīng)過組織的結(jié)構(gòu)化知識表示方法。然而框架結(jié)構(gòu)并沒有形成對應(yīng)的理論架構(gòu),框架、槽和側(cè)面等單位沒有明確的語義??梢越M成框架網(wǎng)絡(luò),反映有層次或很復(fù)雜的關(guān)系,代表完整的知識結(jié)構(gòu),能夠說明復(fù)雜的知識內(nèi)容。附加過程是關(guān)鍵特征,可以融合描述性知識和過程性知識,形成有機的一體化系統(tǒng)。已經(jīng)推出很多基于框架理論的通用知識語言,但是增加用戶建立知識庫的負擔??蚣艿闹饕攸c:第四節(jié)語義網(wǎng)絡(luò)一、語義網(wǎng)絡(luò)的概念和結(jié)構(gòu)1968年J.R.Quillian首先提出語義網(wǎng)絡(luò)1972年Simon確定語義網(wǎng)絡(luò)的基本概念語義網(wǎng)絡(luò)為一個帶標識的有向圖,其中帶有標識的結(jié)點表示問題領(lǐng)域中的物體、概念、事件、動作或勢態(tài),結(jié)點之間的有向弧也帶有標識,表示結(jié)點之間的語義聯(lián)系。有時又將弧稱為聯(lián)想弧,所以語義網(wǎng)絡(luò)又稱為聯(lián)想網(wǎng)絡(luò)。第四節(jié)語義網(wǎng)絡(luò)一、語義網(wǎng)絡(luò)的概念和結(jié)構(gòu)典型的語義聯(lián)系有四類:(1)分類建立在個體的值與類之間。把一組同樣類型的個體值劃歸在某種類型之下,這種個體值叫做類的實例,構(gòu)成Instance-of關(guān)系第四節(jié)語義網(wǎng)絡(luò)一、語義網(wǎng)絡(luò)的概念和結(jié)構(gòu)典型的語義聯(lián)系有四類:(2)聚類常使用part-of表示個體與其組成成分之間的關(guān)系。第四節(jié)語義網(wǎng)絡(luò)一、語義網(wǎng)絡(luò)的概念和結(jié)構(gòu)典型的語義聯(lián)系有四類:(3)泛化常使用is-a表示個體屬于一種確切的類型。第四節(jié)語義網(wǎng)絡(luò)一、語義網(wǎng)絡(luò)的概念和結(jié)構(gòu)典型的語義聯(lián)系有四類:(4)聯(lián)合常使用member-of表示個體與整體之間的聯(lián)系,當個體概念不重要而需要強調(diào)整體的某些性質(zhì)時則引入。第四節(jié)語義網(wǎng)絡(luò)二、語義網(wǎng)絡(luò)特性傳遞方式“特性傳遞”是將高層概念的特性繼承下來。有三類:(1)直接傳遞(pass)子結(jié)點直接把父結(jié)點的屬性繼承過來。第四節(jié)語義網(wǎng)絡(luò)二、語義網(wǎng)絡(luò)特性傳遞方式“特性傳遞”是將高層概念的特性繼承下來。有三類:(2)附加傳遞(add)子結(jié)點綜合父結(jié)點的特性和自身特性,不發(fā)生矛盾時可以推出新的特性。第四節(jié)語義網(wǎng)絡(luò)二、語義網(wǎng)絡(luò)特性傳遞方式“特性傳遞”是將高層概念的特性繼承下來。有三類:(3)排斥傳遞(exclude)子結(jié)點特性與父結(jié)點特性不相容情況下,僅取子結(jié)點的特性,抑制父結(jié)點特性的傳遞。第四節(jié)語義網(wǎng)絡(luò)三、聯(lián)結(jié)詞在語義網(wǎng)絡(luò)中的表示方法(1)合取合取命題通過引入“與”結(jié)點來表示(2)析取析取命題通過引入“或”結(jié)點來表示。(3)否定對于基本命題的否定,可以直接采用~ISA,~AKO及~part-of的有向弧來標識(4)蘊含通過引入蘊含關(guān)系結(jié)點來表示規(guī)則中前提條件和結(jié)論之間的因果聯(lián)系第五節(jié)產(chǎn)生式表示法最初來源于邏輯學家Post在1943年提出的一種計算形式體系Newell和Simon(1972)之后修改了產(chǎn)生式規(guī)則產(chǎn)生式適合于表示有下列特點的領(lǐng)域知識:①領(lǐng)域知識由許多相對獨立的知識元組成,彼此間關(guān)系不密切,不存在結(jié)構(gòu)關(guān)系,例如化學反應(yīng)等;②領(lǐng)域知識多是經(jīng)驗性的,沒有精確、統(tǒng)一的理論,例如醫(yī)療診斷等;③領(lǐng)域問題的求解過程可被表示為一組相對獨立的操作,一個操作可被表示為一條或多條產(chǎn)生式規(guī)則。第五節(jié)產(chǎn)生式表示法一、產(chǎn)生式表示法的基本形式特別適合表示“如果P則Q”的因果關(guān)系,通常的表示形式為:P→Q或者IFPTHENQ其中,P指的是一組前提,Q指的是一個或多個結(jié)論。解釋為“若前提P被滿足,那么可推出結(jié)論Q”例如:r1:IF動物飛行AND產(chǎn)蛋THEN該動物為鳥類其中,r1是該產(chǎn)生式規(guī)則的編號不確定性規(guī)則知識的產(chǎn)生式的主要形式是:

P→Q(置信度)或者IFPTHENQ(置信度)其中,置信度表示知識正確的可能性例如:r2:IF發(fā)燒THEN感冒(0.6)第五節(jié)產(chǎn)生式表示法二、產(chǎn)生式系統(tǒng)一個典型的產(chǎn)生式系統(tǒng)由三個主要部分組成:知識庫也叫規(guī)則庫。涵蓋了關(guān)于問題領(lǐng)域的通用性知識。全局數(shù)據(jù)庫具有解決確定問題的事實依據(jù)。推理機

運行問題求解過程的規(guī)則解釋程序第五節(jié)產(chǎn)生式表示法三、產(chǎn)生式的復(fù)合形式可交換的產(chǎn)生式系統(tǒng)

當一個產(chǎn)生式系統(tǒng)對于任何一個綜合數(shù)據(jù)庫D具備如下性質(zhì)時,稱作可交換的產(chǎn)生式系統(tǒng):①設(shè)R是適用于D的規(guī)則集,當使用R中任一條規(guī)則改變D的狀態(tài)后,該R對D依然適用;②假設(shè)滿足目標條件,那么當R中任一個可適用的規(guī)則所生成的新綜合數(shù)據(jù)庫依然滿足目標條件;③如果對D使用某一規(guī)則序列,獲得新的綜合數(shù)據(jù)庫D’,那么當改變規(guī)則的使用次序后,依然可以獲得D'。

對于可交換的產(chǎn)生式系統(tǒng),求解時只需要選用任一個規(guī)則序列就可對問題求解,而不必探索多個序列,從而節(jié)省了時間,提高了求解的效率。第五節(jié)產(chǎn)生式表示法三、產(chǎn)生式的復(fù)合形式可分解的產(chǎn)生式系統(tǒng)如果全局數(shù)據(jù)庫的每一個狀態(tài)都用一切可能的規(guī)則進行匹配,就會得到很多個匹配序列,造成時間和空間的浪費。為了避免這種情況的發(fā)生,可根據(jù)全局數(shù)據(jù)庫的狀態(tài)分成幾個可獨立處理的子庫,分別對它們應(yīng)用規(guī)則求解。由于把初始數(shù)據(jù)庫分解為若干個子庫,這就減少了組合情況,加快了問題求解的步伐。像這樣可把全局數(shù)據(jù)庫進行分解,從而盡快求得問題的解的產(chǎn)生式系統(tǒng)稱為可分解的產(chǎn)生式系統(tǒng)。第五節(jié)產(chǎn)生式表示法四、產(chǎn)生式表示的優(yōu)缺點自然性模塊性有效性清晰性優(yōu)點:效率較低缺點:不能表示具有結(jié)構(gòu)性的知識第六節(jié)過程表示法一、過程表示法的概念將知識包含在若干過程之中,這些過程就是一小段程序,處理某些特殊事件或特殊狀況。每個過程都包含說明客體和事件的知識,以及在說明完好的情況下的運行知識。過程通常用子程序或模塊實現(xiàn)。在問題求解中,當需要使用某個過程時,調(diào)用相應(yīng)的程序并執(zhí)行。過程表示法的知識庫是一組過程集合。過程表示模式可以表示啟發(fā)式知識,能夠產(chǎn)生更好的推理過程的特定論域信息,在模擬人們的缺省推理等非形式推理方面也有很大優(yōu)勢。第六節(jié)過程表示法二、過程表示法的過程規(guī)則激發(fā)條件包含推理方向和調(diào)用模式兩部分。演繹操作由多個子目標組成,當滿足前面的激發(fā)條件時,執(zhí)行演繹操作。狀態(tài)轉(zhuǎn)換對綜合數(shù)據(jù)庫的增、刪、改。返回過程規(guī)則的最后一個語句,指出將控制權(quán)返回到調(diào)用該過程規(guī)則的上一級規(guī)則。包括四部分:第六節(jié)過程表示法三、過程表示法的優(yōu)缺點有利于表示啟發(fā)式知識能實現(xiàn)擴充邏輯推理(如缺省推理等)具有高度模塊化的優(yōu)點能夠通過類比進行推理優(yōu)點:知識隱含在過程之中難于修改和證明缺點:固定的控制信息限定了其他可能的方法第七節(jié)狀態(tài)空間表示法一、狀態(tài)空間表示法的定義一種基于解答空間的問題表示和求解方法,其基礎(chǔ)是狀態(tài)和操作符。系統(tǒng)的一種簡單的數(shù)學描述,特別適合于數(shù)字計算的時間范疇表示法,是現(xiàn)代控制原理中重點研究的問題。來自早期的問題求解系統(tǒng)和博弈程序,自身不是一種知識表示形式,只是利用它在問題的多種可能狀態(tài)集合中作出更好的選擇,來表示問題的結(jié)構(gòu)。狀態(tài)空間搜索模式包含一個規(guī)則集合,一條規(guī)則即為一個變換算子,完成狀態(tài)1到狀態(tài)2的轉(zhuǎn)移。執(zhí)行一個算子序列就是問題求解。第七節(jié)狀態(tài)空間表示法二、狀態(tài)空間表示法的組成(1)狀態(tài)狀態(tài)是描述問題求解過程中不同時刻狀態(tài)的數(shù)據(jù)結(jié)構(gòu)。通常用一組變量的有序集合表示:Q=(q0,q1,…,qn)元素qi(i=0,1,2,…,n)是集合的分量,稱作狀態(tài)變量。當賦值給每一個分量時,便有一個具體的狀態(tài)。包括四部分:第七節(jié)狀態(tài)空間表示法二、狀態(tài)空間表示法的組成(2)算符導(dǎo)致狀態(tài)的分量發(fā)生一定變化,把問題從一個狀態(tài)變成另一個狀態(tài)的操作稱為算符。算符可分為走步、規(guī)則、過程、數(shù)學算子、運算符號或邏輯符號等。比如,在產(chǎn)生式系統(tǒng)中,每一條產(chǎn)生式規(guī)則就是一個算符;在下棋程序中,一個算符即為一個走步。包括四部分:第七節(jié)狀態(tài)空間表示法二、狀態(tài)空間表示法的組成(3)狀態(tài)空間表示一個問題的全部狀態(tài)和所有可用算符構(gòu)成的集合叫作問題的狀態(tài)空間。通常有三部分組成:問題的一切可能初始狀態(tài)構(gòu)成的集合S;算符集合F;目標狀態(tài)集合G。使用三元組表示:(S,F(xiàn),G)。狀態(tài)空間的圖示形式叫做狀態(tài)空間圖。其中,節(jié)點表示狀態(tài);有向弧表示算符。包括四部分:第七節(jié)狀態(tài)空間表示法二、狀態(tài)空間表示法的組成(4)問題的解從問題的初始狀態(tài)集S開始,進行一系列的算符運算,達到目標狀態(tài)。從初始狀態(tài)至目標狀態(tài)所用算符的序列組成了問題的一個解。包括四部分:第八節(jié)面向?qū)ο蟊硎痉ㄒ?、對象、消息和方法對象:?<ID,DS,MS,MI>標識符ID又稱對象名,用于表示一個特定的對象。數(shù)據(jù)結(jié)構(gòu)DS能夠描述對象當前的內(nèi)部狀態(tài)或其具有的靜態(tài)屬性,并且通常由一組<屬性名屬性值>表示。方法集合MS用于說明對象所具有的內(nèi)部處理方法或?qū)κ芾硐⒌牟僮鬟^程,反映對象自身的智能行為。消息接口MI為對象相關(guān)內(nèi)部方法和接收外部信息驅(qū)動唯一的對外接口。此處的外部信息就是消息。當接收者受理發(fā)送者的某一消息時,首先需要對該消息屬于哪一消息模式進行判斷,找出內(nèi)部方法與之匹配,接著執(zhí)行與該消息相聯(lián)的方法,處理相應(yīng)的消息或響應(yīng)某些信息。一個對象的形式定義由四元組表示:第八節(jié)面向?qū)ο蟊硎痉ǘ㈩?、類層次和繼承性類的概念是將具有共同屬性的一組對象歸為一類。類的定義為具有相同外部特征和內(nèi)部實現(xiàn)的一組對象的抽象。在一個類的上層有超類,而在其下層有子類,因此形成了類的層次結(jié)構(gòu),稱為類層次。繼承分為多重繼承和簡單繼承。如果一個類可以直接繼承多個類描述的特征就是多重繼承。如果一個類只能具有一個超類或只能繼承一個類描述的特征則是簡單繼承。所有面向?qū)ο蟮恼Z言都提供了一套機制用于繼承,用戶通常可以通過特定的關(guān)鍵字提供期望的映射類型,并且可以在某些情況下附加信息。第八節(jié)面向?qū)ο蟊硎痉ㄈ?、面向?qū)ο笾R表示與語義網(wǎng)絡(luò)、框架系統(tǒng)的比較結(jié)構(gòu)化的知識表示方法包括語義網(wǎng)絡(luò)、框架系統(tǒng)和面向?qū)ο笾R表示,其中面向?qū)ο笾R表示是其中最為結(jié)構(gòu)化的方法。語義網(wǎng)絡(luò)具有靈活性的優(yōu)點,可以無限制地定義網(wǎng)絡(luò)中的節(jié)點和有向弧。語義網(wǎng)絡(luò)的主要不足在于難以開發(fā)和維護的系統(tǒng),而面向?qū)ο蠓椒ǖ姆庋b性能夠有效地克服語義網(wǎng)絡(luò)的這一弊端。框架結(jié)構(gòu)與面向?qū)ο蟮慕Y(jié)構(gòu)很類似,知識都可以使用類的概念按一定的層次結(jié)構(gòu)來組織。第九節(jié)

基于范例表示法一、范例的定義基于范例問題求解方法是將以前已解決的問題經(jīng)驗與當前需要解決的問題聯(lián)系在一起,把需要解決的問題稱為目標,而過去已經(jīng)解決的問題稱為范例。當目標與范例之間存在相似性,其推理求解過程依賴于這種相似性,推理源于目標之間相似元素的相互映射。范例是從與目標域同一個一般的問題域中抽取的,因而具有相同的結(jié)構(gòu)。范例是在同一問題類別中原先已求解過的實例。第九節(jié)

基于范例表示法二、范例的表示知識的表示不僅應(yīng)該使知識成為一個結(jié)構(gòu)化和組織化的系統(tǒng),而且還應(yīng)該確保記憶的知識是易于存取、檢索以及學習的。心理學的研究者專注于記憶的一般理論,并提出了許多記憶模型,例如情節(jié)記憶episodicmemory)、語義網(wǎng)絡(luò)(semanticnetwork)和聯(lián)想記憶(associativememory)等。Schank的動態(tài)記憶理論將知識記憶在一些結(jié)構(gòu)中。主要有以下四種類型的結(jié)構(gòu):記憶組織包(MemoryOrganizationPacket,MOP),劇本(Script),場景(Scene),主題記憶包(ThematicOrganizationPacket,TOP)。第九節(jié)

基于范例表示法三、語義記憶單元語義記憶單元是在學習、分析、理解和記住知識的過程中重點關(guān)注的概念、模式、主題等,以及據(jù)此形成的知識本身的特征,這些因素能夠有效地將知識內(nèi)在聯(lián)系在一起。語義記憶單元的功能是概括具體知識和具體問題的某個方面,并認識到具體知識和具體問題的更抽象的本質(zhì)。對于很新的知識,把其中的概念作為首要的記憶對象。隨著關(guān)于此類知識的積累愈加豐富,在具備了關(guān)于具體問題的分析能力之后,便可從中概括出一些抽象的概念性的認識。第九節(jié)

基于范例表示法四、記憶網(wǎng)記憶網(wǎng)是通過使用語義記憶單元作為結(jié)點并連接語義記憶單元之間的各種關(guān)系而建立的網(wǎng)絡(luò);模型所記憶的知識相互間不是孤立存在的,而是一個集成的體系,它們通過某種內(nèi)在的因素彼此間形成緊密或松散的有機聯(lián)系。其它表達方式表示的理論知識與具體范例可以被記憶和使用;對較為特殊的知識的記憶,可以通過對結(jié)點施加約束達到目的;相似的知識可以被內(nèi)涵結(jié)點組織起來;記憶單元能夠作為一個主體,獨立地完成某些任務(wù)。第十節(jié)基于RoughSet表示法一、粗糙集的基本概念粗糙集(Roughset)理論是一種研究不精確、不確定性知識的數(shù)字工具,由波蘭科學家Pawlak在1982年提出。粗糙集把客觀世界或?qū)ο笫澜绯橄鬄橐粋€信息系統(tǒng),或知識表達系統(tǒng)S,也稱屬性-值系統(tǒng)。S=<U,A,V,f>式中,U是一組對象(或事例)的有限集合,稱為論域;如果有n個對象,則U可表示為:U={x1,x2,....,xn}。A表示有限個屬性的有限集合,設(shè)存在m個屬性,則A={a1,a2,....,am};而V表示屬性的值域集,V={V1,V2,...,Vm},其中Vi表示屬性Ai的值域;進一步可以將有限集合A劃分為兩個不相交的集合,分別為條件屬性集C和決策屬性集D,C和D滿足A=C∪D且C∩D=?,其中D一般只有一個屬性;f表示信息函數(shù)(informationfunction),f:U×A→V,f(xi,aj)∈Vj。第十節(jié)基于RoughSet表示法二、基于粗糙集的知識表示知識表達系統(tǒng)可以方便地使用表格來表達知識,并且知識的表格表達法可以認為是一種特殊的形式語言,使用符號表示等價關(guān)系,這樣的數(shù)據(jù)表就是知識表達系統(tǒng)??梢酝ㄟ^知識表達系統(tǒng)的定義來描述與知識庫有關(guān)的所有定義。故知識系統(tǒng)內(nèi)的任一等價關(guān)系在知識系統(tǒng)數(shù)據(jù)表中以一個屬性和屬性表示的關(guān)系的等價類進行表示,表中的列可以描述某些范疇的名稱,而整個數(shù)據(jù)表則將相應(yīng)的知識庫中所有范疇的描述包含在內(nèi),包括所有能從表中數(shù)據(jù)推導(dǎo)出的一切可能的規(guī)律,其中數(shù)據(jù)標志是用于描述表達系統(tǒng)對知識庫中有效事實和規(guī)律的方法。第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示一、人工神經(jīng)網(wǎng)絡(luò)的基本思想假設(shè)信息處理是通過大量稱為“單元”的簡單處理元件交互進行的,每個單元都對上層的單元發(fā)出激勵或抑制信號?!安⑿行浴笔侵妇W(wǎng)絡(luò)針對全局的,所有的目標都同時進行處理;“分布性”是指信息分布在整個網(wǎng)絡(luò)內(nèi)部,每個節(jié)點及其連線上只表達部分信息,而不是一個完整的概念。人工神經(jīng)網(wǎng)絡(luò)學習過程所獲得的知識,分布式地存儲于網(wǎng)絡(luò)連結(jié)權(quán)系數(shù)中,使網(wǎng)絡(luò)有很高的容錯性和魯棒性。人工神經(jīng)網(wǎng)絡(luò)的自組織、自適應(yīng)學習功能,大大放松了傳統(tǒng)識別方法所需的約束條件,使對某些識別問題顯示出極大的優(yōu)越性。第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示二、BP神經(jīng)網(wǎng)絡(luò)的知識表示BP網(wǎng)絡(luò)模型是一個常用的神經(jīng)網(wǎng)絡(luò)模型。網(wǎng)絡(luò)由輸入層、隱含層、輸出層組成,相鄰的層均全連接。輸入信號進入輸入層要先向前傳播到隱節(jié)點,隱節(jié)點將輸入數(shù)據(jù)加權(quán)累加,經(jīng)過激活函數(shù)后,再把隱節(jié)點的輸出信息傳播到輸出節(jié)點,給出輸出結(jié)果。節(jié)點內(nèi)的激活函數(shù)可取為Sigmoid函數(shù)(又稱S函數(shù)),其公式如下:第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示二、BP神經(jīng)網(wǎng)絡(luò)的知識表示BP算法的訓練過程由正向傳播和反向傳播組成。在正向傳播中,輸入信息從輸入層經(jīng)隱含層處理,并傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。當數(shù)據(jù)向前傳遞至輸出層時,將與期望輸出進行對比,如果不能得到期望的輸出,則將計算出損失函數(shù),即誤差信號,此刻轉(zhuǎn)入反向傳播,將誤差信號沿原來的連接通路返回,通過修改各層神經(jīng)元的權(quán)值和偏置,使得誤差信號最小。第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示二、BP神經(jīng)網(wǎng)絡(luò)的知識表示神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示意圖如圖所示,設(shè)輸入層的輸入數(shù)據(jù)為;輸出層數(shù)據(jù)為

。隱含層數(shù)據(jù)設(shè)為,表示隱含層的第層的第列神經(jīng)元的值。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖第十一節(jié)基于神經(jīng)網(wǎng)絡(luò)的知識表示三、神經(jīng)網(wǎng)絡(luò)表示的特點最主要的特點是以分布方式表達信息。神經(jīng)網(wǎng)絡(luò)可以擁有大量知識,若神經(jīng)網(wǎng)絡(luò)輸入層有N個神經(jīng)元,并且以二進制邏輯作為輸入模型,就可提供2N個知識表示的樣本數(shù)。采用隱式表達式表示知識,這與其他知識表示方法不同,后者基本上均為顯式表達。通過神經(jīng)網(wǎng)絡(luò)表達知識,可以實現(xiàn)知識的聯(lián)想功能,因此在模式識別、圖像信息壓縮和優(yōu)化等領(lǐng)域的應(yīng)用取得了較大的進展,即使圖像失真或者畸變也可以進行一定程度上的識別。在一定程度上模擬了專家憑直覺解決不確定性問題的過程。第十二節(jié)

基于本體的知識表示法本體(Ontology)最初是一個哲學上的概念,意為一切存在的根本憑借和內(nèi)在依據(jù),是多樣性的世界賴以存在的共同的基礎(chǔ)。1994年TomGruber提出:“本體是對概念化的清晰的描述(Anontologyisanexplicitspecificationofaconceptualization)。本質(zhì)上,本體是一個或幾個領(lǐng)域的概念以及反映這些概念間的關(guān)系的集合。關(guān)系反映了概念間的約束和聯(lián)系,它本身也是概念,關(guān)系之間也可能構(gòu)成新的關(guān)系”。1998年,Studer等人對上述定義進一步解釋,“概念化涉及通過標識某個現(xiàn)象的相關(guān)概念而得到這個現(xiàn)象的抽象模型。顯式地指出所用到的概念的類型,以及定義概念使用的約束。形式化是指本體應(yīng)該是機器可讀的。共享反映了這樣一個觀念,即本體獲取了一致的知識,它不是某個個體私有的,而是可以被一個群體所接受的”。第十二節(jié) 基于本體的知識表示法一、本體在知識工程領(lǐng)域的研究(1)知識表示本體:本體不限于某種特定領(lǐng)域來對知識描述的語言進行研究。典型的有KIF(KnowledgeInterchangeFormat)、OIL(OntologyInterchangeLanguage)、Ontolingua等。(2)通用或常識本體:涵蓋多個領(lǐng)域并建立龐大的人類常識知識庫,以解決計算機軟件中的脆弱性問題,例如漏洞等。主要研究如SUMO、Cyc工程等。(3)領(lǐng)域本體:它可以在特定區(qū)域中被重用,并提供特定區(qū)域中概念的定義與概念之間的關(guān)系,以及該領(lǐng)域中發(fā)生的活動及其主要理論和基本原理等,例如醫(yī)學概念本體,生物知識庫等。本體通常被分為以下5種類型:第十二節(jié) 基于本體的知識表示法一、本體在知識工程領(lǐng)域的研究(4)語言學本體:它是一種關(guān)于諸如語言和詞匯之類的本體。以WordNet為例,它是Princeton大學開發(fā)的一個龐大的語言知識庫系統(tǒng),以詞匯源文件作為核心,一個源文件都包含一組“synsets”單元,每組“synsets”單元都由一組同義詞、一組關(guān)系指針以及其他信息組成,由關(guān)系指針表示的關(guān)系包括繼承和反義。(5)任務(wù)本體:共享問題解決方法和推理的研究與領(lǐng)域無關(guān)。具體的研究主題包括:通用任務(wù)、任務(wù)方法結(jié)構(gòu)、與任務(wù)相關(guān)的體系結(jié)構(gòu)、任務(wù)結(jié)構(gòu)和推理結(jié)構(gòu)等。例如Chandrasekaran等人的關(guān)于任務(wù)和問題求解方法本體的研究。本體通常被分為以下5種類型:第十二節(jié) 基于本體的知識表示法二、基于本體的知識表示1.沖壓工藝領(lǐng)域本體的定義根據(jù)TomGruber對本體的定義以及沖壓工藝領(lǐng)域的特點,對沖壓工藝領(lǐng)域本體定義如下:沖壓工藝領(lǐng)域本體是對沖壓工藝領(lǐng)域中存在的概念的一種詳盡的特征化描述,即是對沖壓工藝領(lǐng)域內(nèi)的概念、關(guān)系、屬性和規(guī)則四要素的一種描述,是實現(xiàn)領(lǐng)域知識共享和重用的基礎(chǔ)。以沖壓工藝設(shè)計的領(lǐng)域本體為例:第十二節(jié) 基于本體的知識表示法二、基于本體的知識表示具體的:定義1設(shè)O是沖壓工藝領(lǐng)域D的本體,則O={({C},{Re},{A},{Ru})|Ci∈D,i=1..m,Rej∈D,j=1..n,Ak∈D,k=1..p,Rul∈D,l=1..q},其中C稱為概念集合,Re稱為關(guān)系集合,A稱為屬性集合,Ru稱為規(guī)則集合。定義2概念是沖壓工藝領(lǐng)域中規(guī)范化的、公認的術(shù)語,是具有相同屬性或行為的對象的集合。它除了指一般意義上的概念,還可以指沖壓工藝方面的任務(wù)、功能、行為等。如圓孔、彎曲是一般意義上的概念,毛坯排樣、條料排樣是沖壓的行為,將這些也作為概念來處理。以沖壓工藝設(shè)計的領(lǐng)域本體為例:第十二節(jié) 基于本體的知識表示法二、基于本體的知識表示具體的:定義3關(guān)系是領(lǐng)域概念間的連接或關(guān)聯(lián)。關(guān)系存在于多個概念之間。關(guān)系本身在概念化的過程中可以概念的形式存在,關(guān)系之間也可以構(gòu)成新的關(guān)系。沖壓工藝概念間的關(guān)系主要有精度約束和靠近約束等。定義4屬性是領(lǐng)域中的概念所具備性質(zhì)的抽象。屬性反映概念的特性,包含類型特性和語義描述。類型特性指屬性的名稱、屬性的類型(如字符型,整型等)等。語義描述指屬性的功能和目的,記錄屬性的內(nèi)容。定義5規(guī)則Rule=(Condition,Conclusion,CF),其中Condition表示前提,Conclusion表示結(jié)論,CF表示可信度。以沖壓工藝設(shè)計的領(lǐng)域本體為例:第十二節(jié) 基于本體的知識表示法二、基于本體的知識表示2.沖壓工藝領(lǐng)域本體的BNF范式是對本體定義的形式化描述,是領(lǐng)域本體的知識表示,也是本體構(gòu)建的基礎(chǔ)。其BNF范式如下:①<沖壓工藝領(lǐng)域

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論