中醫(yī)古籍文本本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第1頁(yè)
中醫(yī)古籍文本本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第2頁(yè)
中醫(yī)古籍文本本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第3頁(yè)
中醫(yī)古籍文本本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第4頁(yè)
中醫(yī)古籍文本本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

桂枝1002附子1003厚樸1004杏仁1005大靑龍湯1006姜湯1007豬苓湯1008門(mén)冬1009烏梅1010芍藥1011竹葉1012葛根1013茯苓1014白朮1015瓜蒂1016萊萸1017牡蠣1018柴胡1019人參1020白虎湯1021青皮1022橘皮1023地黃1024黃連1025雄黃1026赤小豆1027瓜蒂1028柴胡1029梔子1030樸硝然后將每種方劑對(duì)應(yīng)每種藥品在Excel表格中用數(shù)字替換并對(duì)應(yīng)起來(lái),并轉(zhuǎn)換為Matlab中讀取的.csv格式,如圖3-4:圖3-4部分替換編號(hào)后的數(shù)據(jù)數(shù)據(jù)分析采用的平臺(tái)及算法實(shí)現(xiàn)本論文數(shù)據(jù)分析采用的Matlab2018b,是mathworks官方開(kāi)發(fā)的新版本的商業(yè)數(shù)學(xué)軟件,適合對(duì)大型數(shù)據(jù)集運(yùn)行分析,matlab代碼可以與其他語(yǔ)言集成,擁有更多數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)選項(xiàng),并且速度比以往更快。適合用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等多個(gè)領(lǐng)域[11]。編寫(xiě)的主函數(shù)代碼及數(shù)據(jù).csv文件,首先使用uigetfile函數(shù)打開(kāi)需要處理的數(shù)據(jù)文件,如箭頭所指Serial_drug文件,main為主函數(shù),apriori_data是通過(guò)length函數(shù)和for循環(huán)重構(gòu)后的矩陣,apriori_drug為生產(chǎn)的頻繁項(xiàng)集和置信度、支持度,如圖3-6所示:圖3-5主函數(shù)及csv文件部分代碼文件如下,完整代碼在附錄%表格讀取數(shù)據(jù)處理clear[filename1,pathname]=uigetfile('*.csv','打開(kāi)文件');%選擇文件ifpathname~=0filename=strcat(pathname,filename1);[dataheader]=xlsread(filename);endAB=data;ddno=1;while~isempty(AB)[usitemhb,lb]=find(AB(:,1)==AB(1,1));usitno=length(usitemhb);fori=1:usitnoii=usitemhb(i);B(ddno,1)=AB(1,1);B(ddno,i+1)=AB(ii,2);endAB(1:usitno,:)=[];ddno=ddno+1;endIT=unique(data(:,2));save('apriori_data.mat','IT','B');clearloadapriori_dataZZ=[NaN];ZZ=[ZZ;B(:,1)];userno=length(B(:,1));IT=IT';itemno=length(IT);ZZ(1,2:1+itemno)=IT;fora=1:usernoforb=2:length(B(1,:))ifB(a,b)[aa,bb]=find(ZZ(1,:)==B(a,b));ZZ(a,bb)=1;endendendsave('apriori_data2.mat','ZZ');頻繁項(xiàng)集的挖掘結(jié)果當(dāng)tth=1(最小支持度計(jì)數(shù)),置信度0.2時(shí),最終運(yùn)行結(jié)果:1009,1014,1043,1026,1027,1046如圖3-6所示圖3-6支持度為1結(jié)果當(dāng)tth=2(最小支持度計(jì)數(shù))時(shí),置信度為0.2時(shí),最終運(yùn)行結(jié)果頻繁集項(xiàng)為1026,1027,1046。如圖3-7所示圖3-7支持度為2結(jié)果Apriori算法在每次迭代經(jīng)過(guò)后,大于支持度的項(xiàng)集被保留為頻繁項(xiàng)集,最終生成的規(guī)則由最終的頻繁項(xiàng)集組成,因此跟著提高最小支持度計(jì)數(shù),最終得到的頻繁集也會(huì)相應(yīng)減少。本章小節(jié)本章首先介紹了Apriori算法的具體實(shí)現(xiàn)流程,然后設(shè)計(jì)了Aprioiri算法,詳細(xì)介紹了使用Matlab2018b對(duì)預(yù)處理后的藥方數(shù)據(jù)進(jìn)行Apriori算法數(shù)據(jù)挖掘的過(guò)程,并簡(jiǎn)要分析了挖掘結(jié)果。

研究結(jié)果分析關(guān)聯(lián)規(guī)則挖掘結(jié)果藥對(duì)之間的關(guān)聯(lián)規(guī)則挖掘藥對(duì)之間的關(guān)聯(lián)規(guī)則,研究藥物與藥物之間的配對(duì)關(guān)系。設(shè)定最小支持度計(jì)數(shù)為2,最小置信度閉值為0.2,得到藥對(duì)之間的一維關(guān)聯(lián)結(jié)果如圖4-1圖4-1一維關(guān)聯(lián)結(jié)果經(jīng)過(guò)對(duì)照藥物表?yè)Q算后,1009:烏梅,1012:葛根;1014:白術(shù),1020:白虎湯,1023,地黃;1027:瓜蒂,1031,三黃;1035,麻黃;1037,小柴胡湯;1040,小承氣湯,1046:秫米。表4-1關(guān)聯(lián)規(guī)則列表1關(guān)聯(lián)規(guī)則支持度置信度烏梅<=>白術(shù)0.0149250.33333烏梅<=>白術(shù)0.0149250.33333烏梅<=>地黃0.0298510.33333葛根<=>麻黃0.0149250.5小承氣湯<=>白虎湯0.0149250.5瓜蒂<=>秫米0.0298510.66667秫米<=>瓜蒂0.0298510.66667三黃<=>麻黃0.0298510.33333秫米<=>麻黃0.0298510.33333保持最小支持度計(jì)數(shù)為2不變,最小置信度閉值為0.002時(shí),如圖4-2圖4-2修改最小置信度的關(guān)聯(lián)結(jié)果對(duì)比表3-1,因?yàn)闇p低了置信度閉值,增加了以下的關(guān)聯(lián)規(guī)則:表4-2關(guān)聯(lián)規(guī)則列表2關(guān)聯(lián)規(guī)則支持度置信度白虎湯<=>烏梅0.0149250.16667麻黃<=>葛根0.0149250.11111地黃<=>烏梅0.0149250.16667白虎湯<=>牡蠣0.0149250.16667白虎湯<=>小承氣湯0.0149250.16667地黃<=>麻黃0.0298510.16667保持置信度為0.2不變,修改最小支持度計(jì)數(shù)為3:圖4-3修改最小支持度計(jì)數(shù)的關(guān)聯(lián)結(jié)果關(guān)聯(lián)規(guī)則由原來(lái)的13條減至8條,提高了最小支持度計(jì)數(shù),相當(dāng)于提高了判斷是否為頻繁項(xiàng)的閾值,造成關(guān)聯(lián)項(xiàng)的減少。藥物之間關(guān)聯(lián)結(jié)果分析中醫(yī)開(kāi)方時(shí)藥物經(jīng)常成對(duì)或成組配伍出現(xiàn),它們有某些功效相同或相似,或一藥能增強(qiáng)另一藥的治療作用,可用于治療同一個(gè)或同一類疾病?!叭藚?、白虎湯”二藥配伍應(yīng)用,兩藥藥性相互促進(jìn),清熱益氣生津效果倍增。藥對(duì)“瓜蒂、赤小豆”合用可除濕消、腫清、熱解毒、排膿,藥對(duì)“赤小豆、秫米”均有消渴、止泄、利小便、吐逆的功效,藥對(duì)“秫米、瓜蒂”配對(duì)可以治療黃疸,面目爪甲皆黃,心膈躁悶,有清熱涼血的功效。白虎湯、赤小豆、秫米之間均有較強(qiáng)的關(guān)聯(lián)性。從上面強(qiáng)相關(guān)的藥對(duì)結(jié)果可知,中醫(yī)藥方主要運(yùn)用的是清熱瀉火解毒、涼血止血治療方法,與中醫(yī)治療的思想不謀而合,表明挖掘的結(jié)果符合中醫(yī)相關(guān)理論,具有較好的臨床參考價(jià)值。對(duì)于挖掘得到的處方藥物之間的頻繁項(xiàng)集進(jìn)行分析發(fā)現(xiàn)具有寶貴價(jià)值,可以體現(xiàn)治療疫病的藥對(duì),如“人參、白虎湯”清熱益氣生津;藥對(duì)“瓜蒂、赤小豆”濕消、腫清、熱解毒、排膿;在藥對(duì)的基礎(chǔ)上可以擴(kuò)展為相應(yīng)的藥組、方劑等,這對(duì)于新藥的配置與開(kāi)發(fā)均具有重要的意義。對(duì)于現(xiàn)階段沒(méi)有相關(guān)經(jīng)驗(yàn)證實(shí)的相關(guān)規(guī)則,例如“秫米、人參”等,可進(jìn)一步通過(guò)醫(yī)學(xué)實(shí)驗(yàn)或醫(yī)學(xué)觀察等,研究其之間的相關(guān)關(guān)系,以輔助關(guān)聯(lián)規(guī)則結(jié)果的解釋[12]。本章小節(jié)本章具體分析了數(shù)據(jù)挖掘的結(jié)果,對(duì)其結(jié)合中醫(yī)學(xué)進(jìn)行了解釋,通過(guò)分析得到的關(guān)聯(lián)規(guī)則結(jié)果,表明通過(guò)關(guān)聯(lián)規(guī)則能夠得到有效的中醫(yī)藥數(shù)據(jù)挖掘結(jié)果,符合中醫(yī)相關(guān)理論,具有較好的臨床參考價(jià)值,同時(shí)敘述了對(duì)中醫(yī)古籍?dāng)?shù)字化的思考與展望??偨Y(jié)與展望中醫(yī)古籍?dāng)?shù)字的思考和展望1.國(guó)家戰(zhàn)略規(guī)劃確立與制度體系完善近年來(lái)古籍?dāng)?shù)字化成果卓著,但是在此過(guò)程中因無(wú)序開(kāi)發(fā)導(dǎo)致選題重復(fù)、數(shù)據(jù)垃圾增多、資源浪費(fèi)的現(xiàn)象日益突出。針對(duì)該問(wèn)題,已有很多學(xué)者已經(jīng)提出了很好的解決對(duì)策,即制定中長(zhǎng)期戰(zhàn)略規(guī)劃,并且相關(guān)部門(mén)也提出了一系列制度。但是,目前缺乏一個(gè)獨(dú)立、權(quán)威的執(zhí)行和監(jiān)管機(jī)構(gòu)[13]??墒?,當(dāng)前缺乏一個(gè)獨(dú)立、權(quán)威的執(zhí)行和監(jiān)管機(jī)構(gòu)。由于古籍?dāng)?shù)字化事業(yè)的效果公益性、主體多元性、發(fā)展不均衡等特點(diǎn)決定了政府參與的必要性。2.推動(dòng)古籍?dāng)?shù)字化資源統(tǒng)一發(fā)布平臺(tái)建設(shè)應(yīng)建立古籍?dāng)?shù)字化資源統(tǒng)一發(fā)布平臺(tái),既可以促進(jìn)資源共享,又有利于推廣古籍?dāng)?shù)字化產(chǎn)品,起到優(yōu)化資源服務(wù)作用。具體而言,第一,對(duì)現(xiàn)有古籍?dāng)?shù)字資源有效整合與導(dǎo)航,可以提高用戶搜索效率。第二,通過(guò)免費(fèi)獲取部分資源,或其他非經(jīng)濟(jì)途徑抵償獲取(如善本、孤本的使用權(quán)轉(zhuǎn)讓,承擔(dān)古籍?dāng)?shù)字化產(chǎn)品制作微任務(wù),古籍?dāng)?shù)字化產(chǎn)品體驗(yàn)后改進(jìn)意見(jiàn)反饋等),促進(jìn)資源共享,培養(yǎng)潛在用戶。第三,有助于最新古籍?dāng)?shù)字化產(chǎn)品的宣傳和推廣,保障古籍?dāng)?shù)字化企業(yè)的經(jīng)濟(jì)收益和可持續(xù)發(fā)展[14]。3.推動(dòng)數(shù)字化技術(shù)的發(fā)展,全面實(shí)現(xiàn)知識(shí)挖掘古籍?dāng)?shù)字化的發(fā)展趨勢(shì)是深度分析和知識(shí)挖掘,對(duì)內(nèi)容專家和技術(shù)專家提出了更高的要求。以中文古籍為例,需要內(nèi)容專家建立大型資料庫(kù)系統(tǒng)地整理古籍字形、完善古籍相關(guān)背景內(nèi)容的數(shù)據(jù)庫(kù)、描述預(yù)期達(dá)到的智能分析目標(biāo);技術(shù)專家通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)內(nèi)容專家所描述的智能分析目標(biāo)。其中,字形庫(kù)和語(yǔ)料庫(kù)的完善,以及漢字處理技術(shù)的提高是高效精準(zhǔn)地知識(shí)挖掘功能實(shí)現(xiàn)的前提,計(jì)算機(jī)技術(shù)的突破是古籍?dāng)?shù)據(jù)庫(kù)知識(shí)挖掘和智能分析的難點(diǎn)[15]。所以,需要內(nèi)容專家和技術(shù)專家加強(qiáng)合作,促進(jìn)知識(shí)全面挖掘。本文重點(diǎn)是研究中醫(yī)古籍文本分析,中醫(yī)古籍是我國(guó)優(yōu)秀的民族文化遺產(chǎn),在長(zhǎng)期的醫(yī)療實(shí)踐中積累了大量數(shù)據(jù)信息,其中蘊(yùn)含著豐富的醫(yī)學(xué)知識(shí),將現(xiàn)代信息技術(shù)與中醫(yī)信息資源相結(jié)合,利用Matlab和Apriori算法對(duì)《傷寒九十論》進(jìn)行數(shù)據(jù)挖掘,分析挖掘

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論