中醫(yī)古籍文本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第1頁(yè)
中醫(yī)古籍文本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第2頁(yè)
中醫(yī)古籍文本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第3頁(yè)
中醫(yī)古籍文本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第4頁(yè)
中醫(yī)古籍文本分析系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

桂枝1002附子1003厚樸1004杏仁1005大靑龍湯1006姜湯1007豬苓湯1008門冬1009烏梅1010芍藥1011竹葉1012葛根1013茯苓1014白朮1015瓜蒂1016萊萸1017牡蠣1018柴胡1019人參1020白虎湯1021青皮1022橘皮1023地黃1024黃連1025雄黃1026赤小豆1027瓜蒂1028柴胡1029梔子1030樸硝然后將每種方劑對(duì)應(yīng)每種藥品在Excel表格中用數(shù)字替換并對(duì)應(yīng)起來,并轉(zhuǎn)換為Matlab中讀取的.csv格式,如圖3-4:圖3-4部分替換編號(hào)后的數(shù)據(jù)數(shù)據(jù)分析采用的平臺(tái)及算法實(shí)現(xiàn)本論文數(shù)據(jù)分析采用的Matlab2018b,是mathworks官方開發(fā)的新版本的商業(yè)數(shù)學(xué)軟件,適合對(duì)大型數(shù)據(jù)集運(yùn)行分析,matlab代碼可以與其他語(yǔ)言集成,擁有更多數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)選項(xiàng),并且速度比以往更快。適合用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等多個(gè)領(lǐng)域[11]。編寫的主函數(shù)代碼及數(shù)據(jù).csv文件,首先使用uigetfile函數(shù)打開需要處理的數(shù)據(jù)文件,如箭頭所指Serial_drug文件,main為主函數(shù),apriori_data是通過length函數(shù)和for循環(huán)重構(gòu)后的矩陣,apriori_drug為生產(chǎn)的頻繁項(xiàng)集和置信度、支持度,如圖3-6所示:圖3-5主函數(shù)及csv文件部分代碼文件如下,完整代碼在附錄%表格讀取數(shù)據(jù)處理clear[filename1,pathname]=uigetfile('*.csv','打開文件');%選擇文件ifpathname~=0filename=strcat(pathname,filename1);[dataheader]=xlsread(filename);endAB=data;ddno=1;while~isempty(AB)[usitemhb,lb]=find(AB(:,1)==AB(1,1));usitno=length(usitemhb);fori=1:usitnoii=usitemhb(i);B(ddno,1)=AB(1,1);B(ddno,i+1)=AB(ii,2);endAB(1:usitno,:)=[];ddno=ddno+1;endIT=unique(data(:,2));save('apriori_data.mat','IT','B');clearloadapriori_dataZZ=[NaN];ZZ=[ZZ;B(:,1)];userno=length(B(:,1));IT=IT';itemno=length(IT);ZZ(1,2:1+itemno)=IT;fora=1:usernoforb=2:length(B(1,:))ifB(a,b)[aa,bb]=find(ZZ(1,:)==B(a,b));ZZ(a,bb)=1;endendendsave('apriori_data2.mat','ZZ');頻繁項(xiàng)集的挖掘結(jié)果當(dāng)tth=1(最小支持度計(jì)數(shù)),置信度0.2時(shí),最終運(yùn)行結(jié)果:1009,1014,1043,1026,1027,1046如圖3-6所示圖3-6支持度為1結(jié)果當(dāng)tth=2(最小支持度計(jì)數(shù))時(shí),置信度為0.2時(shí),最終運(yùn)行結(jié)果頻繁集項(xiàng)為1026,1027,1046。如圖3-7所示圖3-7支持度為2結(jié)果Apriori算法在每次迭代經(jīng)過后,大于支持度的項(xiàng)集被保留為頻繁項(xiàng)集,最終生成的規(guī)則由最終的頻繁項(xiàng)集組成,因此跟著提高最小支持度計(jì)數(shù),最終得到的頻繁集也會(huì)相應(yīng)減少。本章小節(jié)本章首先介紹了Apriori算法的具體實(shí)現(xiàn)流程,然后設(shè)計(jì)了Aprioiri算法,詳細(xì)介紹了使用Matlab2018b對(duì)預(yù)處理后的藥方數(shù)據(jù)進(jìn)行Apriori算法數(shù)據(jù)挖掘的過程,并簡(jiǎn)要分析了挖掘結(jié)果。

研究結(jié)果分析關(guān)聯(lián)規(guī)則挖掘結(jié)果藥對(duì)之間的關(guān)聯(lián)規(guī)則研究藥物對(duì)之間的相關(guān)規(guī)則,研究藥物與藥物之間的匹配關(guān)系。將最小支持計(jì)數(shù)設(shè)置為2,將最小置信極限設(shè)置為0.2。圖4-1一維關(guān)聯(lián)結(jié)果經(jīng)過對(duì)照藥物表?yè)Q算后,1009:烏梅,1012:葛根;1014:白術(shù),1020:白虎湯,1023,地黃;1027:瓜蒂,1031,三黃;1035,麻黃;1037,小柴胡湯;1040,小承氣湯,1046:秫米。表4-1關(guān)聯(lián)規(guī)則列表1關(guān)聯(lián)規(guī)則支持度置信度烏梅<=>白術(shù)0.0149250.33333烏梅<=>白術(shù)0.0149250.33333烏梅<=>地黃0.0298510.33333葛根<=>麻黃0.0149250.5小承氣湯<=>白虎湯0.0149250.5瓜蒂<=>秫米0.0298510.66667秫米<=>瓜蒂0.0298510.66667三黃<=>麻黃0.0298510.33333秫米<=>麻黃0.0298510.33333保持最小支持度計(jì)數(shù)為2不變,最小置信度閉值為0.002時(shí),如圖4-2圖4-2修改最小置信度的關(guān)聯(lián)結(jié)果對(duì)比表3-1,因?yàn)闇p低了置信度閉值,增加了以下的關(guān)聯(lián)規(guī)則:表4-2關(guān)聯(lián)規(guī)則列表2關(guān)聯(lián)規(guī)則支持度置信度白虎湯<=>烏梅0.0149250.16667麻黃<=>葛根0.0149250.11111地黃<=>烏梅0.0149250.16667白虎湯<=>牡蠣0.0149250.16667白虎湯<=>小承氣湯0.0149250.16667地黃<=>麻黃0.0298510.16667保持置信度為0.2不變,修改最小支持度計(jì)數(shù)為3:圖4-3修改最小支持度計(jì)數(shù)的關(guān)聯(lián)結(jié)果關(guān)聯(lián)規(guī)則從13削減到8,最小支持計(jì)數(shù)增加。這與為了判斷是否是頻繁的項(xiàng)目而提高閾值是一樣的,減少相關(guān)項(xiàng)目的數(shù)量。藥物間相關(guān)關(guān)系的分析。傳統(tǒng)的中藥,在處方的時(shí)候,常常以成對(duì)或組合的形式表示。這些藥物具有相同或相似的特定療效,或者一種藥物可以提高另一種藥物的療效,用于治療相同或相同類型的疾病。這兩種藥“面包人參和白湖煎藥”的相溶性,促進(jìn)了這兩種藥的特性,祛熱、補(bǔ)氣、補(bǔ)氣的效果加倍。與“瓜蒂和奇沙頭”合用,對(duì)濕氣、浮腫、發(fā)燒、解毒、化膿有效果。有止渴,止瀉,排尿,嘔吐的作用,對(duì)“西沙”有效果?!癕i,Guadi”雙環(huán)可以治療黃疸,面部指甲都是黃色的,心臟的橫膈膜不穩(wěn)定,有去除體溫,冷卻血液的效果。BaihuTang,Chixiaodou,Mizu都強(qiáng)相關(guān)。從上述強(qiáng)效相關(guān)藥物對(duì)的結(jié)果可以看出,傳統(tǒng)中藥主要采用清熱、去火、解毒、止血的方法。這與傳統(tǒng)中藥的治療思路一致,采掘結(jié)果與傳統(tǒng)中藥的相關(guān)理論一致,具有優(yōu)勢(shì)。臨床參考值在發(fā)掘出的處方藥中,對(duì)常用物品的分析具有重要的價(jià)值,可以反映出對(duì)治療傳染病的藥,如“人參、白虎湯”等,具有退熱補(bǔ)氣的作用。膨潤(rùn),熱解毒,并包漿;根據(jù)藥物對(duì),可以擴(kuò)展到對(duì)應(yīng)的藥物組,處方等。這些對(duì)新藥的構(gòu)成和開發(fā)非常重要?!皒iemi,ginseng”等,在此階段沒有相關(guān)的經(jīng)驗(yàn),根據(jù)確認(rèn)相關(guān)規(guī)則,為了支援聯(lián)系規(guī)則的結(jié)果的解釋,通過醫(yī)學(xué)實(shí)驗(yàn)或醫(yī)學(xué)觀察它們之間的相關(guān)關(guān)系,可以進(jìn)一步調(diào)查[12]。4.2這一章的章節(jié)在這一章中,具體分析數(shù)據(jù)挖掘的結(jié)果,說明與中藥的組合。根據(jù)通過分析得到的相關(guān)規(guī)則的結(jié)果,使用相關(guān)規(guī)則的結(jié)果可以得到中藥有效的數(shù)據(jù)挖掘結(jié)果。參考值同時(shí)也說明了古代中醫(yī)書籍?dāng)?shù)字化的思維方式和前景??偨Y(jié)與展望5.1.1古代中醫(yī)書籍?dāng)?shù)量的考察與展望1。確立和完善國(guó)家戰(zhàn)略計(jì)劃近年來,舊書數(shù)字化成果顯著,但在此過程中,無序的開發(fā)重復(fù)了話題的選擇,數(shù)據(jù)垃圾不斷增加,造成資源浪費(fèi)。對(duì)于這個(gè)問題,很多學(xué)者已經(jīng)提出了制定長(zhǎng)期戰(zhàn)略計(jì)劃的優(yōu)秀解決方案,相關(guān)部門也提出了一系列系統(tǒng)建議。但是,目前沒有獨(dú)立的權(quán)威執(zhí)行和監(jiān)管機(jī)構(gòu)[13]。但是,現(xiàn)在沒有獨(dú)立的權(quán)威執(zhí)行及監(jiān)督機(jī)構(gòu)。公共福利的影響,主題的多樣化,古代書籍?dāng)?shù)字化的不均勻發(fā)展,決定了政府參與的必要性。2。促進(jìn)建立古代書籍?dāng)?shù)字資源的統(tǒng)一出版平臺(tái)需要建立統(tǒng)一的古代書籍?dāng)?shù)字資源發(fā)行平臺(tái)。這不僅促進(jìn)了資源共享,也促進(jìn)了古代書籍的數(shù)字產(chǎn)品推廣,有助于資源服務(wù)的優(yōu)化。具體來說,首先,現(xiàn)有的古籍?dāng)?shù)字資源可以有效的整合和導(dǎo)航,提高用戶的搜索效率。第二,對(duì)部分資源的免費(fèi)上網(wǎng),或其他非經(jīng)濟(jì)性手段取得(稀有的書籍,孤兒使用權(quán)利的轉(zhuǎn)讓,為古代書籍的數(shù)碼產(chǎn)品的生產(chǎn)的微型任務(wù)的實(shí)施,古代的書籍的數(shù)碼產(chǎn)品的體驗(yàn)后的反饋的改善等),資源的共享和栽培的促進(jìn)潛在的用戶。第三,它有助于古代書籍的最新數(shù)字產(chǎn)品的宣傳和推廣,保證古代書籍的數(shù)字企業(yè)的經(jīng)濟(jì)效益和可持續(xù)發(fā)展[14]。3。推進(jìn)充分實(shí)現(xiàn)知識(shí)挖掘的數(shù)字技術(shù)開發(fā)古代書籍?dāng)?shù)字化的發(fā)展趨勢(shì)是詳細(xì)的分析和知識(shí)挖掘,對(duì)內(nèi)容專家和技術(shù)專家提出了更高的要求。中國(guó)古代的書為例,內(nèi)容的專家,從古代的書的字體,并系統(tǒng)整理古代的書的改善相關(guān)的背景信息的數(shù)據(jù)庫(kù),預(yù)計(jì)智能分析的目標(biāo),為了說明有必要構(gòu)建大規(guī)模數(shù)據(jù)庫(kù)。技術(shù)專家使用計(jì)算機(jī)技術(shù)來實(shí)現(xiàn)內(nèi)容專家所描述的智能分析的目標(biāo)。其中,グリフデータベース和語(yǔ)料庫(kù)的改良、漢字處理技術(shù)的提高,有效準(zhǔn)確的知識(shí)挖掘功能的前提條件,也是計(jì)算機(jī)技術(shù)的底部,在古文獻(xiàn)數(shù)據(jù)庫(kù)的知識(shí)挖掘和智能分析的困難[15]。因此,內(nèi)容專家和技術(shù)專家需要加強(qiáng)合作,促進(jìn)全面的知識(shí)挖掘。這篇文章將重點(diǎn)放在古代中醫(yī)書籍的文本分析上。古代中醫(yī)書籍是中國(guó)卓越的國(guó)家文化遺產(chǎn)。在長(zhǎng)期的醫(yī)療實(shí)踐中,現(xiàn)代信息技術(shù)與傳統(tǒng)中醫(yī)的信息資源相結(jié)合,積累了大量的數(shù)據(jù)信息,包括豐富的醫(yī)學(xué)知

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論