知識(shí)圖譜發(fā)展由來(lái)和關(guān)鍵技術(shù)_第1頁(yè)
知識(shí)圖譜發(fā)展由來(lái)和關(guān)鍵技術(shù)_第2頁(yè)
知識(shí)圖譜發(fā)展由來(lái)和關(guān)鍵技術(shù)_第3頁(yè)
知識(shí)圖譜發(fā)展由來(lái)和關(guān)鍵技術(shù)_第4頁(yè)
知識(shí)圖譜發(fā)展由來(lái)和關(guān)鍵技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

知識(shí)圖譜發(fā)展由來(lái)、關(guān)鍵技術(shù)和應(yīng)用2傳統(tǒng)知識(shí)管理的收集和表現(xiàn)方式傳統(tǒng)知識(shí)收集更多依賴(lài)專(zhuān)家的力量收集的知識(shí)以分類(lèi)、全文檢索等方式,被動(dòng)的等待查找。需要的知識(shí)點(diǎn)往往淹沒(méi)在知識(shí)的海洋中。3傳統(tǒng)管理系統(tǒng)更多的從推送方式進(jìn)行信息管理傳統(tǒng)的管理系統(tǒng)更多的是從推送的方式進(jìn)行信息整理,不太考慮知識(shí)查找和利用知識(shí)建模表達(dá)能力不足信息密度較低知識(shí)應(yīng)用知識(shí)管理難以融合多源數(shù)據(jù)無(wú)法形成知識(shí)體系知識(shí)構(gòu)建專(zhuān)家維護(hù)成本高領(lǐng)域遷移難度大知識(shí)難以深度消費(fèi)無(wú)法支撐智能應(yīng)用傳統(tǒng)知識(shí)管理需要多角度的信息,比如質(zhì)量特性需要從故障、檢測(cè)、維修、保障等多個(gè)角度對(duì)產(chǎn)品進(jìn)行設(shè)計(jì)分析,數(shù)據(jù)形態(tài)多樣、數(shù)據(jù)蘊(yùn)含的語(yǔ)義結(jié)構(gòu)復(fù)雜,現(xiàn)有的數(shù)據(jù)處理方式不能和設(shè)計(jì)緊密結(jié)合,面對(duì)復(fù)雜業(yè)務(wù)場(chǎng)景的智能化處理能力較弱。傳統(tǒng)知識(shí)管理的挑戰(zhàn)各個(gè)行業(yè)都面臨數(shù)據(jù)爆炸的困境數(shù)據(jù)爆炸44ZB法律行業(yè)4億卷宗醫(yī)療行業(yè)增長(zhǎng)率48%/年行業(yè)數(shù)據(jù)體量巨大利用率低0.4%金融行業(yè)80%非結(jié)構(gòu)化轉(zhuǎn)化困難人工構(gòu)建Freebase$2.25/條知識(shí)密集型

服務(wù)業(yè)14大行業(yè)客服行業(yè)3000億500萬(wàn)行業(yè)知識(shí)需求廣泛人力成本數(shù)據(jù)爆炸引發(fā)帶來(lái)知識(shí)碎片化,進(jìn)而影響注意力知識(shí)碎片化特征:它往往是事實(shí)的集合而非邏輯的集合它往往簡(jiǎn)化推理過(guò)程它往往由多路徑到單一路徑它往往不嚴(yán)謹(jǐn)、全面在一個(gè)信息豐富的世界,大量的信息內(nèi)容意味著某種東西的缺乏。無(wú)論它是什么,肯定是因信息消耗引起的缺乏。而大量的信息消耗的是什么,這是顯而易見(jiàn)的,它消耗的是信息接受者的注意力。因此信息的豐富促成了注意力的缺乏。——諾貝爾經(jīng)濟(jì)學(xué)家赫伯特·西蒙知識(shí)需要進(jìn)一步整合在大數(shù)據(jù)時(shí)代,知識(shí)工程是從大數(shù)據(jù)中自動(dòng)或半自動(dòng)獲取知識(shí),建立基于知識(shí)的系統(tǒng),以提供互聯(lián)網(wǎng)智能知識(shí)服務(wù)。大數(shù)據(jù)對(duì)智能服務(wù)的需求,已經(jīng)從單純的搜集獲取信息,轉(zhuǎn)變?yōu)樽詣?dòng)化的知識(shí)服務(wù)。我們需要利用知識(shí)工程為大數(shù)據(jù)添加語(yǔ)義/知識(shí),使數(shù)據(jù)產(chǎn)生智慧(smartdata),完成從數(shù)據(jù)到信息到知識(shí),最終到智能應(yīng)用的轉(zhuǎn)變過(guò)程,從而實(shí)現(xiàn)對(duì)大數(shù)據(jù)的洞察、提供用戶(hù)關(guān)心問(wèn)題的答案、為決策提供支持、改進(jìn)用戶(hù)體驗(yàn)等目標(biāo)。智慧知識(shí)知識(shí)圖譜、時(shí)空數(shù)據(jù)信息結(jié)構(gòu)化、向量化、集中化數(shù)據(jù)文本視頻圖片數(shù)倉(cāng)語(yǔ)義理解信息抽取圖譜構(gòu)建知識(shí)鏈接知識(shí)理解知識(shí)計(jì)算知識(shí)推理沉淀精準(zhǔn)的答案挖掘的模式推理的結(jié)論數(shù)據(jù)整合互聯(lián)網(wǎng)全文索引私有云RDBS向量索引圖譜索引時(shí)空索引語(yǔ)義網(wǎng)絡(luò)語(yǔ)義網(wǎng)絡(luò)作為知識(shí)表示的一種方法被提出,主要用于自然語(yǔ)言理解領(lǐng)域Web萬(wàn)維網(wǎng)之父蒂姆·伯納斯·李發(fā)明萬(wàn)維網(wǎng)(1991年Niches提出知識(shí)本體的概念)機(jī)構(gòu)知識(shí)庫(kù)知識(shí)表示和知識(shí)組織開(kāi)始被深入研究,并廣泛應(yīng)用到各機(jī)構(gòu)單位的資料整理工作中。本體論(Ontology)和知識(shí)工程哲學(xué)概念“本體”被引入到人工智能領(lǐng)域用來(lái)刻畫(huà)知識(shí)。1977年知識(shí)工程被首次提出,專(zhuān)家系統(tǒng)開(kāi)始廣泛研究語(yǔ)義網(wǎng)從超文本鏈接到語(yǔ)義鏈接知識(shí)圖譜谷歌發(fā)布了其關(guān)于知識(shí)的搜索引擎產(chǎn)品19601980s1989199820022012大數(shù)據(jù)技術(shù)使得大規(guī)模獲取知識(shí)成為可能,而知識(shí)圖譜即為一種大規(guī)模語(yǔ)義網(wǎng)絡(luò)。這樣的一個(gè)知識(shí)規(guī)模上的量變帶來(lái)了知識(shí)效用的質(zhì)變。知識(shí)庫(kù)傳統(tǒng)知識(shí)工程大部分都是在規(guī)則明確、邊界清晰、應(yīng)用封閉的場(chǎng)景取得的成功。1、知識(shí)獲取困難,嚴(yán)重依賴(lài)專(zhuān)家2、知識(shí)應(yīng)用困難,難以適應(yīng)不同規(guī)則。從傳統(tǒng)知識(shí)工程到知識(shí)圖譜9什么是知識(shí)圖譜谷歌高級(jí)副總裁艾米特·辛格博士指出知識(shí)圖譜的重要意義:構(gòu)成這個(gè)世界的是實(shí)體,而非字符串(things,notstrings)知識(shí)圖譜實(shí)現(xiàn)對(duì)客觀世界從字符串描述到結(jié)構(gòu)化語(yǔ)義描述,是對(duì)客觀世界的知識(shí)映射(mappingworldknowledge)。知識(shí)圖譜富含實(shí)體、概念、屬性、關(guān)系等信息,使得機(jī)器理解與解釋成為可能。http://knowledgeworks.cn/cndbpedia/search10知識(shí)圖譜與人工智能的關(guān)系11知識(shí)圖譜的核心關(guān)鍵點(diǎn)知識(shí)表示推薦對(duì)話AGC問(wèn)答搜索知識(shí)計(jì)算關(guān)系挖掘標(biāo)簽挖掘半結(jié)構(gòu)化知識(shí)挖掘開(kāi)放知識(shí)挖掘結(jié)構(gòu)化解析實(shí)體融合屬性歸一實(shí)體歸一本體構(gòu)建異構(gòu)數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)調(diào)度知識(shí)推理數(shù)據(jù)生產(chǎn)平臺(tái)數(shù)據(jù)開(kāi)放平臺(tái)圖存儲(chǔ)系統(tǒng)知識(shí)圖譜知識(shí)補(bǔ)全與擴(kuò)展知識(shí)獲取知識(shí)整合知識(shí)圖譜認(rèn)知應(yīng)用技術(shù)知識(shí)收錄模型架構(gòu)與平臺(tái)評(píng)論挖掘知識(shí)解析圖檢索系統(tǒng)圖譜策略框架合作數(shù)據(jù)引入關(guān)注點(diǎn)挖掘更新知識(shí)圖譜是一款具有AI能力的知識(shí)圖譜生成和管理工具套件,包含知識(shí)引入、圖譜構(gòu)建、圖數(shù)據(jù)庫(kù)及可視化四個(gè)工具。通過(guò)集成NLP、信息抽取、文檔建模、閱讀理解、機(jī)器學(xué)習(xí)等技術(shù),輔以工程理解,降低知識(shí)圖譜技術(shù)門(mén)檻,節(jié)省構(gòu)建圖譜人力。知識(shí)圖譜總體架構(gòu)13知識(shí)圖譜構(gòu)建——結(jié)構(gòu)化數(shù)據(jù)抽取工藝設(shè)計(jì)PBOM工程設(shè)計(jì)EBOM生產(chǎn)制造MBOM方案設(shè)計(jì)運(yùn)維設(shè)計(jì)任務(wù)書(shū)需求信息系統(tǒng)模型仿真數(shù)據(jù)……三維模型二維工程圖技術(shù)文件仿真數(shù)據(jù)……三維工藝工藝卡片技術(shù)文件仿真數(shù)據(jù)……計(jì)劃信息配套表質(zhì)量單據(jù)履歷書(shū)……數(shù)據(jù)包故障反饋單配件表……以現(xiàn)有的BOM為基礎(chǔ),搭建知識(shí)圖譜的框架,并形成初始的知識(shí)實(shí)體。實(shí)現(xiàn)基于BOM的全生命周期數(shù)據(jù)關(guān)聯(lián)和應(yīng)用,支持產(chǎn)品需求、設(shè)計(jì)、分析、仿真、工藝、制造、運(yùn)維數(shù)據(jù)跟蹤與追溯。知識(shí)圖譜構(gòu)建——非結(jié)構(gòu)化數(shù)據(jù)抽取對(duì)蘊(yùn)含與海量自由文本中的知識(shí)進(jìn)行高準(zhǔn)確率抽取TXT文檔轉(zhuǎn)換器PDF文檔轉(zhuǎn)換器Word文檔轉(zhuǎn)換器Excel文檔轉(zhuǎn)換器語(yǔ)音識(shí)別視頻解析通用預(yù)訓(xùn)練語(yǔ)言模型行業(yè)預(yù)訓(xùn)練語(yǔ)言模型基于行業(yè)規(guī)則的遠(yuǎn)監(jiān)督小樣本標(biāo)注fine-tune知識(shí)圖譜構(gòu)建——知識(shí)抽取的原理向量表示否定確認(rèn)關(guān)系標(biāo)注術(shù)語(yǔ)標(biāo)注主題標(biāo)注文件分類(lèi)邊界識(shí)別主題標(biāo)注歸一補(bǔ)全否定傳遞關(guān)系傳遞主題分析屬性抽取術(shù)語(yǔ)標(biāo)注句式評(píng)價(jià)領(lǐng)域/行業(yè)知識(shí)圖譜認(rèn)知模型語(yǔ)義標(biāo)注經(jīng)驗(yàn)?zāi)P托g(shù)語(yǔ)句式關(guān)系輸入文本歷史數(shù)據(jù)經(jīng)驗(yàn)學(xué)習(xí)結(jié)構(gòu)化輸出評(píng)估/標(biāo)注標(biāo)注數(shù)據(jù)知識(shí)挖掘反饋學(xué)習(xí)語(yǔ)料庫(kù)通過(guò)對(duì)專(zhuān)家知識(shí)的重新梳理,以及結(jié)合各個(gè)業(yè)務(wù)中的實(shí)體定義,建立行業(yè)知識(shí)圖譜。并不斷結(jié)合新的結(jié)構(gòu)化、非結(jié)構(gòu)化文本的分析能力,進(jìn)行經(jīng)驗(yàn)學(xué)習(xí)和反饋學(xué)習(xí),經(jīng)過(guò)經(jīng)驗(yàn)?zāi)P筒粩嗟脑鰪?qiáng),形成認(rèn)知模型。16知識(shí)圖譜存儲(chǔ)和維護(hù)篩選展示內(nèi)容添加關(guān)系圖譜編輯新建實(shí)體知識(shí)圖譜推理和計(jì)算18搜索更好的查詢(xún)語(yǔ)意理解搜索中問(wèn)題的關(guān)系推理結(jié)構(gòu)化展現(xiàn)搜索結(jié)果推薦技術(shù)豐富前端展現(xiàn)內(nèi)容以關(guān)聯(lián)關(guān)系優(yōu)化推薦算法智能問(wèn)答以知識(shí)圖譜為基礎(chǔ)進(jìn)行問(wèn)題回答和答案推理優(yōu)質(zhì)服務(wù)為門(mén)戶(hù)中不同的用戶(hù)提供更個(gè)性化更豐富細(xì)致的服務(wù)IT運(yùn)維從調(diào)用、數(shù)據(jù)庫(kù)訪問(wèn)、緩存讀取、隊(duì)列使用等全鏈路監(jiān)控系統(tǒng)的應(yīng)用層設(shè)備監(jiān)測(cè)分析挖掘設(shè)備子系統(tǒng)、工況、故障、原因、解決方法間的關(guān)聯(lián)關(guān)系核心能力與場(chǎng)景提供對(duì)文本語(yǔ)義中實(shí)體、概念等深度理解解析能力實(shí)體標(biāo)注、漢

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論