基于《數(shù)據(jù)庫原理》的可視化知識圖譜的構(gòu)建及應(yīng)用_第1頁
基于《數(shù)據(jù)庫原理》的可視化知識圖譜的構(gòu)建及應(yīng)用_第2頁
基于《數(shù)據(jù)庫原理》的可視化知識圖譜的構(gòu)建及應(yīng)用_第3頁
基于《數(shù)據(jù)庫原理》的可視化知識圖譜的構(gòu)建及應(yīng)用_第4頁
基于《數(shù)據(jù)庫原理》的可視化知識圖譜的構(gòu)建及應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一、研究背景在“互聯(lián)網(wǎng)+”教學(xué)時(shí)代,學(xué)生面對呈爆炸式增長的學(xué)習(xí)平臺和學(xué)習(xí)資源,容易陷入知識迷航,面對各種質(zhì)量參差不齊的教學(xué)資源無法高速、有效、精準(zhǔn)地在海量信息中找到所需要的學(xué)習(xí)資料?!稊?shù)據(jù)庫原理》課程是一門知識點(diǎn)多、關(guān)聯(lián)性強(qiáng)的專業(yè)必修課程,學(xué)習(xí)者在互聯(lián)網(wǎng)中進(jìn)行學(xué)習(xí)時(shí),很難精準(zhǔn)地找到所需要的學(xué)習(xí)資源。因此,將知識圖譜技術(shù)應(yīng)用到《數(shù)據(jù)庫原理》課程的教學(xué)中,用可視化的形式進(jìn)行知識表達(dá),學(xué)習(xí)者能進(jìn)行有效、科學(xué)地學(xué)習(xí)。因此,將專業(yè)學(xué)科與知識圖譜的可視化相結(jié)合,能提高教學(xué)質(zhì)量,促進(jìn)教育發(fā)展。二、課程知識圖譜知識圖譜是一種語義網(wǎng)絡(luò),對現(xiàn)實(shí)世界的實(shí)體和實(shí)體之間的關(guān)系用可視化的形式顯現(xiàn)出來。知識圖譜通過有向圖把相關(guān)聯(lián)的語義信息連接在一起,能將網(wǎng)絡(luò)大數(shù)據(jù)的應(yīng)用價(jià)值大幅提高。課程知識圖譜是知識圖譜與教育相融合,在教育上的具體應(yīng)用。課程知識圖譜將知識圖譜技術(shù)應(yīng)用于某個學(xué)科或者課程,將課程內(nèi)的所有知識點(diǎn)以(實(shí)體,關(guān)系,實(shí)體)的三元組形式構(gòu)建一個網(wǎng)狀的結(jié)構(gòu)。不同的知識點(diǎn)用“實(shí)體”表示,知識點(diǎn)的關(guān)聯(lián)用“關(guān)系”表示,關(guān)系在直觀上就是有向邊,有起點(diǎn),有終點(diǎn),邊的方向和標(biāo)簽?zāi)苷f明具體的關(guān)系類型。這樣通過知識圖譜可以將知識點(diǎn)、知識點(diǎn)之間的概念以直觀明了的方式呈現(xiàn)在學(xué)習(xí)者面前,以便學(xué)習(xí)者能客觀和清楚地理解知識點(diǎn)和知識之間的關(guān)系。三、《數(shù)據(jù)庫原理》知識圖譜構(gòu)建本文所構(gòu)建的知識圖譜是采用自底向上的方式完成的,首先進(jìn)行了實(shí)體提取的工作,其次構(gòu)建模式層的本體模式。(一)采集、分析數(shù)據(jù)構(gòu)建課程知識圖譜的第一步是獲取大量的數(shù)據(jù)。首先確定領(lǐng)域范圍為《數(shù)據(jù)庫原理》;其次對經(jīng)典數(shù)據(jù)庫教材,高等教育出版社的《數(shù)據(jù)庫系統(tǒng)概論》進(jìn)行人工提取文字內(nèi)容,整理收集成文件;最后以《數(shù)據(jù)庫原理》教材作為參考依據(jù),應(yīng)用網(wǎng)絡(luò)爬蟲技術(shù),對教材中的相關(guān)知識點(diǎn)進(jìn)行數(shù)據(jù)采集,并在維基百科中找到相關(guān)的知識數(shù)據(jù)進(jìn)行下載。應(yīng)用相關(guān)算法對語料庫做處理,自動處理與人工篩選相結(jié)合,對所有數(shù)據(jù)進(jìn)行過濾與整合,得到知識點(diǎn),為《數(shù)據(jù)庫原理》學(xué)科知識圖譜的構(gòu)建提供充分的數(shù)據(jù)支持。(二)概念抽取XLink是基于跨語言知識庫XLORE的實(shí)體鏈接系統(tǒng)。將數(shù)據(jù)收集階段的知識點(diǎn)文檔進(jìn)行輸入,XLink能識別出《數(shù)據(jù)庫原理》知識點(diǎn)文檔中的知識點(diǎn)實(shí)體并鏈接到XLORE相對應(yīng)的實(shí)體上。文本信息和知識庫通過實(shí)體鏈接進(jìn)行橋接,為知識點(diǎn)文本理解提供了外部知識。本文的知識圖譜通過清華實(shí)驗(yàn)室的實(shí)體抽取,XLink接口對之前數(shù)據(jù)收集階段形成的文件中的知識概念進(jìn)行抽取,得到文件中包含的知識概念。BERT模型的全稱是BidirectionalEncoderRepresentationsfromTransformer。BERT模型是多層的Transformer架構(gòu)。在BERT模型中,多層的編碼器進(jìn)行編碼,對句子中的每一個詞應(yīng)用自注意力機(jī)制建立線性相關(guān),詞向量和位置向量在數(shù)據(jù)庫原理知識點(diǎn)中起著關(guān)鍵作用。因此本文將BERT模型引入數(shù)據(jù)庫原理知識點(diǎn)實(shí)體關(guān)系抽取模型框架中,運(yùn)用BERT模型對知識概念進(jìn)行詞向量,然后以種子概念為聚類中心對抽取的知識概念進(jìn)行聚類,得到種子概念聚類后的結(jié)果,聚類越靠前,知識概念和本課程越有關(guān)系。(三)關(guān)系抽取完成了數(shù)據(jù)采集和概念抽取后,將下來的工作是要從數(shù)據(jù)中抽取實(shí)體和關(guān)系。對聚類后的概念和課程對應(yīng)的概念進(jìn)行三元組劃分,構(gòu)造實(shí)體與實(shí)體間的關(guān)系,并將整理好的三元組寫入Neo4j圖形數(shù)據(jù)庫。假設(shè):任意一個實(shí)體對僅有一個關(guān)系。定義了六類實(shí)體對關(guān)系,分別是依賴,被依賴,包含,屬于,無關(guān),有關(guān)。需要特別說明的是,本文構(gòu)建了“章節(jié)概念”,將每一章的內(nèi)容進(jìn)行了知識點(diǎn)的歸納??紤]到課程知識點(diǎn)的特殊性和知識的嚴(yán)謹(jǐn)性,初步對實(shí)體關(guān)系進(jìn)行了人工標(biāo)注。同時(shí)為了增強(qiáng)系統(tǒng)的可擴(kuò)展性,預(yù)留了手工標(biāo)注數(shù)據(jù)的功能,在以后的使用過程中,如果發(fā)現(xiàn)數(shù)據(jù)、關(guān)系有誤差,隨時(shí)可以進(jìn)行更改。四、《數(shù)據(jù)庫原理》知識圖譜可視化在完成了數(shù)據(jù)采集、概念和關(guān)系抽取的工作后,就需要對《數(shù)據(jù)庫原理》知識圖譜進(jìn)行可視化的設(shè)計(jì)與實(shí)現(xiàn)。(一)《數(shù)據(jù)庫原理》知識圖譜的存儲應(yīng)用Python的py2neo,把之前文件中的實(shí)體和關(guān)系三元組全部存儲到Neo4j圖形數(shù)據(jù)庫中,在應(yīng)用Cypher語言對《數(shù)據(jù)庫原理》課程知識圖譜進(jìn)行各種個性化的查詢和路徑分析操作,如圖1所示,各知識點(diǎn)的關(guān)系很直觀清晰地顯示出來。圖1實(shí)體關(guān)系(二)數(shù)據(jù)的展示Django是一個開源的Web框架,它擁有豐富的在線文檔,文檔記錄了完備的信息,特別容易上手進(jìn)行開發(fā)設(shè)計(jì)。Django有強(qiáng)大的數(shù)據(jù)庫訪問組件,方便進(jìn)行數(shù)據(jù)庫的訪問,且界面友好,有效的錯誤提示和幫助,適合連接數(shù)據(jù)庫的應(yīng)用程序。實(shí)現(xiàn)開發(fā)知識圖譜展示W(wǎng)eb頁面,根據(jù)查詢的知識概念,得到該知識概念對應(yīng)的知識圖譜,同時(shí)調(diào)用開源的知識概念解釋接口,獲取對當(dāng)前知識概念的解釋。運(yùn)用Django框架,對Neo4j后臺圖形數(shù)據(jù)庫中的知識圖譜數(shù)據(jù)與Web前端進(jìn)行交互,前端是通過Ajax方法調(diào)用后端接口查找數(shù)據(jù),實(shí)現(xiàn)可視化技術(shù)。(三)可視化平臺的實(shí)現(xiàn)在Web頁面中,默認(rèn)顯示《數(shù)據(jù)庫原理》課程知識指定個數(shù)的節(jié)點(diǎn),在右側(cè)的查詢中輸入查詢的內(nèi)容,能展開查詢節(jié)點(diǎn)的功能。五、知識圖譜效果分析與評價(jià)選擇計(jì)算機(jī)專業(yè)學(xué)生進(jìn)行對比學(xué)習(xí)實(shí)驗(yàn),將40名學(xué)生隨機(jī)分成二組,對比實(shí)驗(yàn)學(xué)習(xí),然后進(jìn)行測試和調(diào)查問卷進(jìn)行學(xué)習(xí)效果分析。測試表明,應(yīng)用課程知識圖譜進(jìn)行學(xué)習(xí),測試時(shí)間有效縮短,測試成績明顯提升。對使用課程知識圖譜學(xué)習(xí)的學(xué)生進(jìn)行問卷調(diào)查。從結(jié)果可以看出90%的學(xué)生認(rèn)為課程知識圖譜使用方便,95%的學(xué)生認(rèn)為知識圖譜能幫助掌握課程整體結(jié)構(gòu),93%的學(xué)生認(rèn)為課程知識圖譜能幫助理解知識間的關(guān)聯(lián)。通過效果分析可知,《數(shù)據(jù)庫原理》課程知識圖譜能幫助學(xué)生掌握知識整體結(jié)構(gòu)和理解知識點(diǎn)之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論