《人工智能概論》 課件 第7章知識圖譜_第1頁
《人工智能概論》 課件 第7章知識圖譜_第2頁
《人工智能概論》 課件 第7章知識圖譜_第3頁
《人工智能概論》 課件 第7章知識圖譜_第4頁
《人工智能概論》 課件 第7章知識圖譜_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第7章知識圖譜——趙克玲本章目標了解知識圖譜的基本概念以及知識架構理解知識圖譜的基本原理了解知識圖譜的表示方式及應用場景知識圖譜引言LadyDianaFrancesSpencer計算機一直面臨的困境:無法獲取網(wǎng)絡文本的語義信息。戴安娜知識圖知識圖譜在搜索引擎上的應用為提高搜索引擎的能力,改善用戶的搜索質(zhì)量、搜索體驗,Google于2012年5月17日正式提出知識圖譜(KnowledgeGraph)的概念。有知識圖譜作為輔助,搜索引擎能夠洞察用戶查詢背后的語義信息,返回更為精準、結構化的信息,更大可能地滿足用戶的查詢需求。知識圖譜定義知識圖譜是Google用于增強其搜索引擎功能的知識庫。本質(zhì)上,知識圖譜旨在描述真實世界中存在的各種實體或概念及其關系,其構成一張巨大的語義網(wǎng)絡圖,節(jié)點表示實體或概念,邊則由屬性或關系構成。

實體指的是具有可區(qū)別性且獨立存在的某種事物。如某一個人、某一個城市、某一種植物等、某一種商品等等。世界萬物由具體事物組成,這就是實體。實體是知識圖譜中最基本的元素,不同實體之間存在不同的關系。知識類型的表示數(shù)據(jù)類型和存儲方式

目前知識大量存在于非結構化的文本數(shù)據(jù)、大量半結構化的表格和網(wǎng)頁以及生產(chǎn)系統(tǒng)的結構化數(shù)據(jù)中。構建知識圖譜的主要目的是獲取大量的、讓計算機可讀的知識。概括來說,知識圖譜的原始數(shù)據(jù)類型一般來說有三類,也就是互聯(lián)網(wǎng)上的三類原始數(shù)據(jù):結構化數(shù)據(jù)、半結構化數(shù)據(jù)、非結構化數(shù)據(jù)。知識圖譜的架構知識圖譜的架構包括自身的邏輯結構以及構建知識圖譜所采用的技術(體系)架構。知識圖譜在邏輯上可分為模式層與數(shù)據(jù)層兩個層次。數(shù)據(jù)層主要由一系列的事實組成,而知識將以事實為單位進行存儲。用(實體1-關系-實體2)、(實體-屬性-屬性值)這樣的三元組來表達事實,可選擇圖數(shù)據(jù)庫作為存儲介質(zhì)。模式層構建在數(shù)據(jù)層之上,是知識圖譜的核心,通常采用本體庫來管理知識圖譜的模式層。知識圖譜的架構知識圖譜的技術實現(xiàn)和應用場景

搜索引擎是現(xiàn)階段最重要的互聯(lián)網(wǎng)入口,也締造了谷歌、百度等巨頭企業(yè)。然而,基于關鍵字的搜索方式,缺乏語義理解,存在著與人的自然需求表達的隔閡,同時其返回的結果需要人消耗大量時間剔除無意義的信息。知識圖譜是下一代搜索引擎、問答系統(tǒng)等智能應用的基礎設施,目前出現(xiàn)的產(chǎn)品有:百度“貼心”、搜狗“知立方”等。1.搜索引擎和問答系統(tǒng)

精準問答:基于結構化數(shù)據(jù)的精準問答,可直接滿足用戶知識檢索的需求。目前提供娛樂、人物、教育、影視、綜藝、動漫、小說、文學作品等。推理運算:基于對知識圖譜豐富的實體屬性和邊關系特征的計算、推理,獲得檢索答案。目前有日期歷法、年齡差、身高差、時間時區(qū)差等分類。通用問答:基于深度學習的全領域通用事實性問答,通過Query解析、自由文本知識抽取和文本的深度理解技術,滿足用戶復雜問答需求。知識問答知識圖譜在問答系統(tǒng)上的數(shù)據(jù)優(yōu)勢

(1)數(shù)據(jù)關聯(lián)度-語義理解智能化程度高。(2)數(shù)據(jù)精度-回答準確率高。(3)數(shù)據(jù)結構化-檢索效率高。知識圖譜在行業(yè)中的典型應用

目前隨著人工智能的不斷發(fā)展知識圖譜已經(jīng)在搜索引擎、聊天機器人、問答系統(tǒng)、臨床決策支持等方面有了一些應用

1.金融領域的應用-----反欺詐、智能投顧2.商業(yè)搜索引擎的應用3.問答系統(tǒng)、社交網(wǎng)絡、電商平臺的應用4.其他應用領域知識圖譜在行業(yè)中的典型應用未來對知識圖譜的展望知識圖譜是知識工程的一個分支,以知識工程中語義網(wǎng)絡作為理論基礎,并且結合了機器學習,自然語言處理和知識表示和推理的最新成果,在大數(shù)據(jù)的推動下受到了業(yè)界和學術界的廣泛關注。知識圖譜對于解決大數(shù)據(jù)中文本分析和圖像理解問題發(fā)揮重要作用。當前知識圖譜發(fā)展還處于初級階段,面臨眾多挑戰(zhàn)和難題,如:知識庫的自動擴展、異構知識處理、推理規(guī)則學習、跨語言檢索等。知識圖譜的構建是多學科的結合,需要知識庫、自然語言理解,機器學習和數(shù)據(jù)挖掘等多方面知識的融合。有很多開放性問題需要學術界和業(yè)界一起解決。本章總結知識圖譜旨在描述真實世界中存在的各種實體或概念及其關系。其構成一張巨大的語義網(wǎng)絡圖,節(jié)點表示實體或概念,邊則由屬性或關系構成三元組的基本形式主要包括(實體1-關系-實體2)和(實體-屬性-屬性值)等知識圖譜在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論