版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第9章
知識圖譜:
從理論到應用常熟理工學院·計算機科學與工程學院目錄1知識圖譜發(fā)展歷史搜索引擎中的知識圖譜23知識圖譜的構(gòu)建實體關(guān)系定義及抽取45Neo4j數(shù)據(jù)庫6知識圖譜典型下游應用1知識圖譜發(fā)展歷史
知識圖譜發(fā)展歷史
知識圖譜的起源第一階段(1955—1977年)是知識圖譜的起源階段,在這一階段中引文網(wǎng)絡分析開始成為一種研究當代科學發(fā)展脈絡的常用方法;知識圖譜的發(fā)展階段第二階段(1977—2012年)是知識圖譜的發(fā)展階段,在這一階段語義網(wǎng)得到快速發(fā)展,“知識本體”的研究開始成為計算機科學的一個重要領域,知識圖譜吸收了語義網(wǎng)、本體在知識組織和表達方面的理念,使得知識更易于在計算機之間和計算機與人之間交換、流通和加工;知識圖譜的繁榮階段第三階段(2012—至今)是知識圖譜繁榮階段,2012年谷歌提出GoogleKnowledgeGraph,知識圖譜正式得名,谷歌通過知識圖譜技術(shù)改善了搜索引擎性能。在人工智能的蓬勃發(fā)展下,知識圖譜涉及到的知識抽取、表示、融合、推理、問答等關(guān)鍵問題得到一定程度的解決和突破,知識圖譜成為知識服務領域的一個新熱點,受到國內(nèi)外學者和工業(yè)界廣泛關(guān)注。
知識圖譜發(fā)展歷史
知識圖譜發(fā)展歷程2搜索引擎中的知識圖譜
搜索引擎中的知識圖譜
未引入知識圖譜方式搜索引擎查詢“老舍先生的作品”返回結(jié)果2012年谷歌公司提出知識圖譜概念,目的是借助知識圖譜技術(shù)來優(yōu)化搜索引擎的搜索效果。當沒有知識圖譜時,搜索服務提供商只能提供信息的檢索,即當用戶輸入查詢到搜索引擎,它會返回那些包含所輸入語句中關(guān)鍵詞的網(wǎng)頁鏈接,用戶如果想進一步了解所搜索問題的答案,那么需要進行二次檢索,快速瀏覽該網(wǎng)頁去尋找答案;搜索引擎無法直接告訴用戶想要的結(jié)果,一是因為它可能無法理解用戶搜索語句的具體語義,二是搜索引擎里面存儲的只有離散的信息,而沒有結(jié)構(gòu)化的知識。為了保證讓用戶點擊更少的網(wǎng)頁來找到想要的答案,谷歌開發(fā)了一個叫pagerank的算法來計算網(wǎng)頁的重要性,在返回搜索結(jié)果的時候,按照計算的網(wǎng)頁重要性進行排序并進行展示。以百度為例,左圖顯示百度搜索引擎普通檢索結(jié)果。搜索引擎先將用戶所輸入的查詢語句進行了分詞處理,然后在全網(wǎng)檢索網(wǎng)頁,查找哪些網(wǎng)頁里包含查詢語句中的關(guān)鍵詞(左圖鏈接中紅色字體文本),然后按照網(wǎng)頁權(quán)重得分顯示給用戶,如果用戶想知道所有老舍先生的作品,需要點擊所有網(wǎng)頁鏈接,然后一一進行統(tǒng)計記錄,最終確定老舍先生的作品都有哪些。當使用知識圖譜的技術(shù)后,檢索結(jié)果如右圖所示,用戶根本不需要點進某些網(wǎng)頁鏈接去統(tǒng)計記錄,搜索引擎直接便捷地給出答案,而且將這些作品匯總好呈現(xiàn)出來。引入知識圖譜方式搜索引擎查詢“老舍先生的作品”返回結(jié)果
搜索引擎中的知識圖譜
未引入知識圖譜方式搜索引擎查詢“李清照丈夫的出生地”返回結(jié)果上述例子是信息檢索,如果我們想搜索知識,那么情況會怎樣呢?下面我們以搜索“李清照丈夫的出生地”為例,未使用知識圖譜策略時示例如左圖所示。顯然也是對網(wǎng)頁的檢索、召回,雖然我們可以直接通過網(wǎng)頁標題就能獲知答案,但是還是不那么直接。接下來是知識圖譜搜索出來的結(jié)果,如圖右圖所示?;卮鸾Y(jié)果一目了然,除了直接告訴用戶想要的結(jié)果之外,瀏覽器還告訴李清照丈夫趙明誠的姓名、身份等其他信息。知識圖譜為什么能直接告訴用戶結(jié)果呢?因為它理解了用戶的查詢請求,而且它具有結(jié)構(gòu)化的語義知識庫,這個知識庫里正好是用戶需要的知識,另外它還具有多步的推理能力。比如上例中,搜索引擎準確的理解了“李清照丈夫”這個人的“出生地”是哪里,所以它先找到了“李清照丈夫”是“趙明誠”這個事實,然后找到“趙明誠”的“出生地”屬性值是“山東諸城”,于是它返回了搜索結(jié)果,這就是一個完整的推理過程。引入知識圖譜方式搜索引擎查詢“李清照丈夫的出生地”返回結(jié)果3知識圖譜的構(gòu)建
知識圖譜的構(gòu)建
01知識圖譜表示02知識圖譜分類
知識圖譜表示
知識圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系,將互聯(lián)網(wǎng)的信息表達成更接近人類認知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。知識圖譜給互聯(lián)網(wǎng)語義搜索帶來了活力,同時也在智能問答中顯示出強大威力,已經(jīng)成為互聯(lián)網(wǎng)知識驅(qū)動的智能應用的基礎設施。目前,知識圖譜與大數(shù)據(jù)和深度學習一起,成為推動互聯(lián)網(wǎng)和人工智能發(fā)展的核心驅(qū)動力之一。
知識圖譜表示
如圖所描述的,在知識圖譜中,各個節(jié)點(現(xiàn)實世界中的事件、數(shù)據(jù)、信息)不再是孤立的,它們是通過特定的關(guān)系(邊)鏈接在一起,從而形成結(jié)構(gòu)化的知識表示,這種圖數(shù)據(jù)結(jié)構(gòu)很容易被人們理解接受,并且也很容易被計算機識別和處理。節(jié)點和關(guān)系<麗江,屬于,云南><大理,屬于,云南><洱海,屬于,大理><小秦,住在,麗江><小明,住在,大理><小明,朋友,小秦>
知識圖譜表示
知識圖譜的核心其實就是三元組,三元組是由實體、屬性或關(guān)系組成的,形式為<實體,關(guān)系,實體>或<實體,屬性,屬性值>;而這樣的三元組正好可以構(gòu)建成圖數(shù)據(jù)格式,如上圖所示的示意圖,可以拆分成三元組的形式如下:<麗江,屬于,云南><大理,屬于,云南><洱海,屬于,大理><小秦,住在,麗江><小明,住在,大理><小明,朋友,小秦>同理,上述三元組也可以組成一個圖結(jié)構(gòu)。在上述三元組中我們只看到了<實體,關(guān)系,實體>類型的三元組,其實在上文中的知識問答搜索例子中我們已經(jīng)見識過<實體,屬性,屬性值>類型的三元組了,比如<趙明誠,出生地,山東諸城>,其中“趙明誠”表示一個實體“人”,“出生地”就是實體“人”的一個屬性,而“山東諸城”正是該屬性的“屬性值”?;谝延腥M可以推導出新的關(guān)系三元組,這對構(gòu)建知識圖譜非常重要,同時這也是知識圖譜具有推理能力的基礎。比如由兩個三元組<翅膀,part-of,鳥>,<麻雀,kind-of,鳥>,可以推導出<翅膀,part-of,麻雀>這樣一個事實。由龐大的知識三元組組成知識圖譜網(wǎng)絡,以結(jié)構(gòu)化的方式將知識組織起來。
知識圖譜分類?通常情況下,知識圖譜可以分成開放(通用)領域知識圖譜和垂直(行業(yè))領域知識圖譜兩大類:開放領域知識圖譜面向的用戶是全部的互聯(lián)網(wǎng)用戶,實際上是谷歌或者百度這樣的搜索公司在構(gòu)建,它的構(gòu)建是以常識性的知識為主,包括結(jié)構(gòu)化的百科知識,它更強調(diào)知識的廣度,而對深度不做更多要求;垂直領域知識圖譜的定位是面向特定的領域或者行業(yè),比如醫(yī)療知識圖譜、工業(yè)知識圖譜等,他的數(shù)據(jù)來源是特定的行業(yè)語料,它強調(diào)知識的深度,而不是廣度。通用知識圖譜和行業(yè)知識圖譜之間并不是相互獨立的,他們是具有互補的關(guān)系,一方面前者會吸納后者的知識來擴充它的知識面,增加知識廣度;另一方面,構(gòu)建行業(yè)知識圖譜也可以從通用知識圖譜里吸納一些常識性的知識作為補充,以形成更完整的行業(yè)知識圖譜。
4實體關(guān)系定義及抽取
實體關(guān)系定義及抽取
01schema定義02數(shù)據(jù)集來源途徑03實體識別和關(guān)系抽取
schema定義知識圖譜的schema定義是一種用于描述知識圖譜中實體、關(guān)系及其屬性的結(jié)構(gòu)化描述。它定義了知識圖譜的組織方式和內(nèi)容規(guī)范,包括實體類型、關(guān)系類型、屬性等。schema定義可以看作是構(gòu)建和組織知識圖譜的“藍圖”或“骨架”。它為知識圖譜中的信息提供了結(jié)構(gòu)和規(guī)則,決定了有哪些類型的東西(實體)和它們之間有哪些關(guān)聯(lián)(關(guān)系)。通過schema,知識圖譜能夠表達出不同領域內(nèi)的概念及其之間的關(guān)系,從而為知識的組織、存儲、查詢和推理提供基礎。打個比方,假設我們在做一本百科全書,這本書需要有清晰的目錄來告訴我們每一章介紹什么內(nèi)容,內(nèi)容之間有什么聯(lián)系。知識圖譜的schema就類似于這個目錄,它規(guī)定了知識圖譜里有哪些章節(jié)(實體類型,如人、公司、地點等),這些章節(jié)之間有什么聯(lián)系(關(guān)系類型,如某人在哪里工作、誰是某人的朋友等),以及每個章節(jié)下面有哪些具體內(nèi)容(屬性,如人的名字、年齡等)。通過schema定義,知識圖譜中的數(shù)據(jù)就能按照統(tǒng)一的結(jié)構(gòu)進行組織和存儲,確保信息可以被準確地查詢、分析和使用。簡單來說,schema定義就是知識圖譜的定義實體、關(guān)系以及屬性類型,讓我們能更好地構(gòu)建和理解這個復雜的知識體系。
schema定義?假設我們要構(gòu)建一個有關(guān)電影的知識圖譜,那么它將包含電影、導演、演員等實體信息,如左1所示。在這個圖譜中,每個實體(如電影、導演、演員)都有特定的屬性和關(guān)系。例如,電影實體可能包含屬性如“電影名稱”、“上映日期”、“類型”等,而導演和演員實體可能包含屬性如“姓名”、“出生日期”等,如右1所示。在知識圖譜的schema定義中,我們還需要定義不同的實體類型(例如電影、導演、演員)之間的關(guān)系,如左2所示。左1電影知識圖譜實體定義實體定義電影(Movie)表示一個電影實體導演(Director)表示一個導演實體演員(Actor)表示一個演員實體左2電影知識圖譜關(guān)系定義關(guān)系定義導演關(guān)系(DirectedBy)定義了電影和導演之間的關(guān)系,表示某個導演執(zhí)導了某部電影演員關(guān)系(ActedIn)定義了演員和電影之間的關(guān)系,表示某個演員出演了某部電影右1電影知識圖譜屬性定義屬性定義電影屬性電影名稱(string)上映日期(date)類型(string)
導演屬性姓名(string)出生日期(date)
演員屬性姓名(string)出生日期(date)
schema定義基于這個schema定義,我們可以構(gòu)建具體的知識圖譜。例如:電影《盜夢空間》由導演克里斯托弗·諾蘭執(zhí)導,主演包括萊昂納多·迪卡普里奧和和瑪麗昂·歌迪亞等。電影《志愿軍:存亡之戰(zhàn)》由陳凱歌執(zhí)導,主演包括朱一龍、辛柏青和張子楓等。在這個例子中,schema為我們提供了一個結(jié)構(gòu)化的框架,用于定義知識圖譜中的各種實體類型及其屬性,以及它們之間的關(guān)系,如下圖所示。schema確保了知識圖譜的設計和數(shù)據(jù)管理具有一致性和可擴展性,使得我們能夠方便地查詢和分析圖譜中的數(shù)據(jù)??偟膩碚f,知識圖譜的schema定義類似于數(shù)據(jù)庫中的表結(jié)構(gòu)設計,決定了數(shù)據(jù)的組織形式和各元素間的關(guān)系,是構(gòu)建和維護知識圖譜的基礎。電影知識圖譜schema定義
數(shù)據(jù)集來源途徑
前面說到,知識圖譜是由若干知識三元組構(gòu)成,但是知識三元組需要人為構(gòu)建,構(gòu)建三元組的原始數(shù)據(jù)來源多種多樣,主要分別結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)。針對不同需求或數(shù)據(jù)所需,選用不同的模方法或工具處理不同類型的數(shù)據(jù)。1.結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)指的是嚴格按照預定義格式和規(guī)則組織的數(shù)據(jù)。這類文本具有明確的字段和數(shù)據(jù)類型,通常呈現(xiàn)為表格形式或數(shù)據(jù)庫中的記錄,每個字段都有特定的含義和數(shù)據(jù)類型(如字符串、數(shù)字、日期等),由于其高度的結(jié)構(gòu)化和規(guī)則性,結(jié)構(gòu)化文本易于存儲、檢索和分析。結(jié)構(gòu)化文本示例(數(shù)據(jù)庫表格)用戶ID姓名年齡郵箱注冊日期001張三25zhangsan@2023-06-15002李四30lisi@2022-12-05003王五28wangwu@2021-09-20
數(shù)據(jù)集來源途徑
2.非結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)是指沒有固定格式或特定數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。這類文本通常以自然語言表達,不遵循嚴格的規(guī)則或字段,因此難以直接通過傳統(tǒng)數(shù)據(jù)庫進行存儲和檢索,如表9-6所示。相對于結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化文本具有高度的自由性和靈活性。非結(jié)構(gòu)化數(shù)據(jù)示例類型文本電子郵件內(nèi)容小王,最近過得怎么樣?想跟你確認一下下周的會議安排,是否需要提前準備什么材料?如果有需要,請隨時告訴我。
祝好,
小李社交媒體帖子剛剛在路邊的小吃攤吃了一碗超級好吃的牛肉面,湯頭濃郁,面條勁道,強烈推薦!#美食分享#牛肉面客戶評論這款手機的拍照功能非常強大,尤其是在弱光環(huán)境下表現(xiàn)也很出色。唯一的缺點是電池續(xù)航有點不夠,希望下次升級能有所改善。新聞文章片段近日,北方多地出現(xiàn)大范圍降溫天氣,部分地區(qū)甚至出現(xiàn)降雪。氣象部門提醒市民做好防寒保暖措施,同時注意交通安全。專家表示,這次冷空氣的影響將持續(xù)到下周。對話記錄甲:今晚一起吃飯嗎?
數(shù)據(jù)集來源途徑
3.半結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)介于結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)之間。它雖然不像結(jié)構(gòu)化數(shù)據(jù)那樣有嚴格的格式和字段,但通常包含一些標記、標簽或分隔符,能夠提供一定程度的組織和結(jié)構(gòu),如表9-7所示。這些標記或標簽使得數(shù)據(jù)可以通過某些規(guī)則進行解析和處理,但整體上仍保留了自由度和靈活性。非結(jié)構(gòu)化數(shù)據(jù)示例類型示例JSON文件<book><title>計算機科學導論</title><author>張三</author><year>2021</year><publisher>科技出版社</publisher></book>電子郵件頭部信息From:alice@To:bob@Subject:會議安排Date:Mon,17Aug202409:00:00+0000
實體識別和關(guān)系抽取構(gòu)建知識圖譜三元組,其中實體關(guān)系抽取是一個關(guān)鍵步驟,實體關(guān)系抽取是一種自然語言處理技術(shù),旨在從各種不同類型,如前一章節(jié)介紹的結(jié)構(gòu)化、非結(jié)構(gòu)化或半結(jié)構(gòu)化文本中自動識別并提取實體及其之間的關(guān)系。通過這項技術(shù),原本沒有明確結(jié)構(gòu)的文本數(shù)據(jù)可以轉(zhuǎn)化為結(jié)構(gòu)化的信息,方便進一步分析和應用。若構(gòu)建知識圖譜所需數(shù)據(jù)存儲形式為CSV或Excel表格,如下圖所示,由于此類數(shù)據(jù)為結(jié)構(gòu)化文本,數(shù)據(jù)已經(jīng)按照一定的格式和規(guī)則進行組織,所以實體關(guān)系抽取較為簡單。excel表格存儲的結(jié)構(gòu)化文本
實體識別和關(guān)系抽取可以使用python的pandas庫來解析CSV或Excel文件,首先選定頭實體,本例中為姓名,其他列信息為尾實體,列名為實體間關(guān)系,由此可得下面所有知識三元組:
知識三元組
<張三,年齡,30>
<張三,性別,男>
<張三,學歷,本科>
<張三,政治面貌,群眾>
<張三,家庭住址,**省**>
實體識別和關(guān)系抽取上述介紹結(jié)構(gòu)化數(shù)據(jù)事先需要人為整理,若沒有成熟的結(jié)構(gòu)化數(shù)據(jù),可以使用爬蟲技術(shù)獲取如百度百科的等頁面上的內(nèi)容,從鍵值對形式的數(shù)據(jù)中獲取實體和關(guān)系,如下圖所示。百度百科中的半結(jié)構(gòu)化文本
實體識別和關(guān)系抽取例如搜索電影《盜夢空間》,可得電影《盜夢空間》的百度百科信息,其中包括屬性以及對應具體的屬性值信息,我們選取“盜夢空間”為頭實體,屬性為實體間關(guān)系,屬性值為尾實體。使用BeautifulSoup或lxml等庫解析網(wǎng)頁的HTML結(jié)構(gòu),提取出正文內(nèi)容,通常從<div>標簽中提取主要的段落、標題和表格信息。可得知識三元組,如下表所示。
知識三元組<盜夢空間,外文名,Inception><盜夢空間,其他譯名,潛行兇間>…<盜夢空間,類型,劇情、科幻、懸疑、冒險><盜夢空間,片長,148分鐘><盜夢空間,上映時間,2010年7月16日><盜夢空間,發(fā)行公司,華納兄弟電影公司>…
實體識別和關(guān)系抽取有些我們所需的知識三元組存在于非結(jié)構(gòu)化文本中,這里我們就無法使用上述兩種方法,需要采用信息抽取技術(shù)對存在于非結(jié)構(gòu)化文本中的實體關(guān)系進行抽取,實體關(guān)系抽取方法多種多樣,有基于深度學習的方法,有依存句法方式,在這里介紹采用依存句法的方式來對預處理完成的非結(jié)構(gòu)化文本進行關(guān)系抽取,句法依存是對目標句子進行分解,從而找出句子間各詞語之間的依存關(guān)系。具體來說,首先將句子進行分詞,然后確定“主”、“謂”、“賓”等詞性,然后通過中文語法進行進一步的分析,基于詞性確定各個詞之間的依賴關(guān)系。常見的依存關(guān)系如下表所示。常用依存關(guān)系以及對應字符表示關(guān)系簡稱關(guān)系簡稱狀中ADV定中ATT主謂SBV核心HED并列C00介賓POB兼語DBL動賓VOB間賓IOB前置賓語FOB獨立結(jié)構(gòu)IS動補CMP
實體識別和關(guān)系抽取例如有一個句子“瓦普尼克教授提出支持向量機。”,依存句法分析結(jié)果首先將句子分為“瓦普尼克”、“教授”、“提出”、“支持向量機”、“。”五部分。然后對各部分詞語進行詞性標注,如“瓦普尼克”被標注成人名“nh”,最后根據(jù)句子中的詞語的詞性確定詞語之間的依存關(guān)系,如圖中箭頭所示,“提出”一詞和“支持向量機”一詞被劃分為“VOB”(動賓)關(guān)系,又經(jīng)句法分析可得“提出”是該句的核心動詞,統(tǒng)轄整個句子,該句子為主謂關(guān)系,如下圖所示。結(jié)合前一階段獲取的實體,可獲取知識三元組<瓦普尼克,提出,支持向量機>。句法分析結(jié)果示例5Neo4j數(shù)據(jù)庫9.Neo4j數(shù)據(jù)庫
圖數(shù)據(jù)庫是一種特殊的數(shù)據(jù)庫管理系統(tǒng),它以圖的形式存儲數(shù)據(jù),其中包含節(jié)點(表示實體)和邊(表示實體之間的關(guān)系)。圖數(shù)據(jù)庫專注于關(guān)系的存儲和查詢,因此在處理關(guān)系密集型數(shù)據(jù)和復雜查詢時非常高效。與傳統(tǒng)的關(guān)系數(shù)據(jù)庫不同,圖數(shù)據(jù)庫提供了一種更自然的方式來表示和處理實體之間的關(guān)系,它們允許高效地執(zhí)行復雜的圖形遍歷和查詢,例如查找與給定節(jié)點相關(guān)聯(lián)的所有節(jié)點或查找特定類型的關(guān)系模式。我們在存儲知識圖譜時選用Neo4j數(shù)據(jù)庫,它是一款領先的圖數(shù)據(jù)庫軟件,采用了屬性圖數(shù)據(jù)模型,它具有高性能的圖數(shù)據(jù)庫引擎和靈活的數(shù)據(jù)模型,能夠有效地處理復雜的圖數(shù)據(jù)結(jié)構(gòu),支持Cypher查詢語言,提供了豐富的圖算法庫和可視化工具,適用于社交網(wǎng)絡分析、推薦系統(tǒng)、網(wǎng)絡安全等領域。9.Neo4j數(shù)據(jù)庫
Cypher是一種專為Neo4j圖數(shù)據(jù)庫設計的查詢語言,類似于SQL。Cypher語言允許開發(fā)者以聲明性的方式查詢和操作圖數(shù)據(jù)庫中的節(jié)點(Nodes)、關(guān)系(Relationships)和屬性(Properties)。它使用一種簡潔且直觀的語法來表達復雜的圖形結(jié)構(gòu)和關(guān)系,使得圖數(shù)據(jù)庫的操作變得更容易理解和使用。1.Cypher語句的基本構(gòu)成在Cypher中,節(jié)點通常用圓括號()來表示,并可以為其添加標簽和屬性。以下表示一個標簽為Person的節(jié)點,帶有兩個屬性name和age。(n:Person{name:"張三",age:30})關(guān)系在Cypher中用方括號[]表示,通常用箭頭-->或<-來表示方向(也可以省略方向表示雙向關(guān)系)。以下表示兩個節(jié)點n和m之間存在一個FRIENDS_WITH關(guān)系。(n)-[:FRIENDS_WITH]->(m)路徑是一組連接在一起的節(jié)點和關(guān)系,通常用于描述從一個節(jié)點到另一個節(jié)點的整個關(guān)系鏈。以下表示節(jié)點n與節(jié)點o之間通過節(jié)點m和兩個關(guān)系相連。(n)-[:FRIENDS_WITH]->(m)-[:LIKES]->(o)9.Neo4j數(shù)據(jù)庫
2.常用Cypher語句這條語句創(chuàng)建一個標簽為Person的節(jié)點n,并設置其name為"張三",age為30。CREATE(n:Person{name:"Alice",age:30})這條語句首先查找名為"Alice"和"Bob"的兩個Person節(jié)點,然后在它們之間創(chuàng)建一個FRIENDS_WITH關(guān)系。MATCH(a:Person{name:"Alice"}),(b:Person{name:"Bob"})CREATE(a)-[:FRIENDS_WITH]->(b)這條語句查詢所有Person節(jié)點之間的FRIENDS_WITH關(guān)系,并返回這些節(jié)點的name屬性。MATCH(a:Person)-[:FRIENDS_WITH]->(b:Person)RETURN,這條語句查找名為"Alice"的Person節(jié)點,并將其age屬性更新為31。MATCH(n:Person{name:"Alice"})SETn.age=31這條語句刪除名為"Alice"的Person節(jié)點及其與另一個Person節(jié)點之間的FRIENDS_WITH關(guān)系。MATCH(n:Person{name:"Alice"})-[r:FRIENDS_WITH]->(m:Person)DELETEr,n9.Neo4j數(shù)據(jù)庫
2.常用Cypher語句這條語句查詢所有從一個Person節(jié)點到另一個Person節(jié)點的路徑,并返回這些路徑。MATCHp=(a:Person)-[:FRIENDS_WITH*]->(b:Person)RETURNp這條語句查詢所有age大于25的Person節(jié)點,并返回這些節(jié)點的name和age。MATCH(n:Person)WHEREn.age>25RETURN,n.age這條語句返回數(shù)據(jù)庫中Person節(jié)點的總數(shù)。MATCH(n:Person)RETURNcount(n)9.Neo4j數(shù)據(jù)庫
下面進行實例展示,展示使用Cypher語句是如何進行Neo4j圖數(shù)據(jù)庫增刪改查的。這里有紅樓夢人物知識三元組,原始三元組有381個,下表僅展示部分,三元組有頭實體、尾實體和關(guān)系。紅樓夢人物關(guān)系知識三元組(部分)頭實體尾實體關(guān)系標簽賈代善賈源son子婁氏賈源daughter_in_law_of_grandson重孫媳婦賈母賈代善wife妻老姨奶奶賈代善concubine妾賈敏賈代善daughter女嫣紅賈赦concubine妾翠云賈赦concubine妾嬌紅賈赦concubine妾9.Neo4j數(shù)據(jù)庫
1.增加操作使用Cypher命令CREATE(n:Person{name:"賈源"})新建實體節(jié)點“賈源”,如圖9-16所示。使用Cypher新建實體節(jié)點“賈代善”9Neo4j數(shù)據(jù)庫
1.增加操作使用Cypher命令CREATE(n:Person{name:"賈代善"})新建實體節(jié)點“賈代善”,如下圖所示。使用Cypher新建實體節(jié)點“賈源”9Neo4j數(shù)據(jù)庫
1.增加操作使用Cypher命令MATCH(a:Person{name:"賈代善"}),(b:Person{name:"賈源"})CREATE(a)-[:子]->(b)新建“賈代善”和“賈源”之間的關(guān)系“子”,如下圖所示。使用Cypher新建實體節(jié)點“賈代善”和“賈源”之間的關(guān)系“子”9Neo4j數(shù)據(jù)庫
1.增加操作使用Cypher語句依次將表格中的三元組關(guān)系新建完畢,可以得到整個紅樓夢人物的知識圖譜,如下圖所示。使用Cypher新建實體節(jié)點“賈代善”和“賈源”之間的關(guān)系“子”9Neo4j數(shù)據(jù)庫
2.刪除操作使用Cypher命令MATCH(n:Person{name:"張三"})-[r:無關(guān)系]->(m:Person)DELETEr,n刪除節(jié)點“張三”及其關(guān)系“無關(guān)系”,下圖是使用刪除命令后的知識圖譜。未使用刪除命令之前知識圖譜9Neo4j數(shù)據(jù)庫
2.刪除操作使用Cypher命令MATCH(n:Person{name:"張三"})-[r:無關(guān)系]->(m:Person)DELETEr,n刪除節(jié)點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年龍游縣機關(guān)事業(yè)單位編外人員招聘備考題庫及完整答案詳解一套
- 2026年威海市教育局直屬學校引進急需緊缺人才備考題庫及1套參考答案詳解
- 2025年清遠市連山壯族瑤族自治縣赴高校招聘教師29人備考題庫及1套完整答案詳解
- 招聘備考題庫XZ2025-428醫(yī)學院專業(yè)、技術(shù)人員及參考答案詳解一套
- 理解記憶課件
- 理數(shù)二輪課件
- 安全生產(chǎn)宣傳視頻制作講解
- 理想養(yǎng)成課件
- 班長課件派發(fā)
- 足浴店長面試技巧
- 村級代管委托協(xié)議書
- 公司屬地化管理制度
- 《SJG29-2023合成材料運動場地面層質(zhì)量控制標準》
- 中考數(shù)學壓軸題專項突破:胡不歸模型(含答案及解析)
- 辦公室裝修改造合同協(xié)議
- 可再生水使用與管理方案計劃
- 公務員2020年國考《申論》真題及答案(省級)
- 安橋功放TX-SR508使用說明書
- 小升初拓展培優(yōu):環(huán)形跑道問題(講義)-2023-2024學年六年級下冊數(shù)學人教版
- 2024年勞務合同協(xié)議樣本(二篇)
- 漢中市考錄公務員(人民警察)政審表
評論
0/150
提交評論