CN114463141B 基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)(廈門(mén)理工學(xué)院)_第1頁(yè)
CN114463141B 基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)(廈門(mén)理工學(xué)院)_第2頁(yè)
CN114463141B 基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)(廈門(mén)理工學(xué)院)_第3頁(yè)
CN114463141B 基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)(廈門(mén)理工學(xué)院)_第4頁(yè)
CN114463141B 基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)(廈門(mén)理工學(xué)院)_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(19)國(guó)家知識(shí)產(chǎn)權(quán)局(12)發(fā)明專(zhuān)利(10)授權(quán)公告號(hào)CN114463141B(65)同一申請(qǐng)的已公布的文獻(xiàn)號(hào)(73)專(zhuān)利權(quán)人廈門(mén)理工學(xué)院地址361024福建省廈門(mén)市集美區(qū)理工路600號(hào)(72)發(fā)明人林開(kāi)標(biāo)陸江濤張楊盧萍(74)專(zhuān)利代理機(jī)構(gòu)廈門(mén)智慧呈睿知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)35222專(zhuān)利代理師陳曉思審查員王箭(54)發(fā)明名稱(chēng)基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)本發(fā)明涉及一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法,包含下述步驟:S1建立醫(yī)療保險(xiǎn)欺詐檢測(cè)AHIN模型;S2選取語(yǔ)義路徑并尋找鄰居節(jié)點(diǎn);S3構(gòu)建基于圖神經(jīng)網(wǎng)絡(luò)的檢挖掘了AHIN中各個(gè)實(shí)體節(jié)點(diǎn)豐富交互關(guān)系,解決了一些醫(yī)保欺詐檢測(cè)方法忽略了多次就診的異常行為特征的問(wèn)題,同時(shí)減少了噪聲節(jié)點(diǎn)、路徑_Z_21.一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)方法,包含下述步驟:S2選取語(yǔ)義路徑并尋找鄰居節(jié)點(diǎn);S3構(gòu)建基于圖神經(jīng)網(wǎng)絡(luò)的檢測(cè)MHAMFD模型;S1-1對(duì)患者的所有就診記錄抽取出來(lái),并從中構(gòu)建患者、醫(yī)院科室、日期和藥物四個(gè)實(shí)S1-2通過(guò)對(duì)真實(shí)就醫(yī)場(chǎng)景中的不同類(lèi)型對(duì)象及其相互作用建模成AHIN,表示為異構(gòu)圖G={V,ε,X},其中V為不同類(lèi)型對(duì)象集,即包括患者、醫(yī)院科室、日期和藥物四個(gè)實(shí)體的設(shè)患者節(jié)點(diǎn)集UCV,對(duì)于數(shù)據(jù)集中每個(gè)患者u∈U都擁有一個(gè)標(biāo)簽Yu∈{0,1},表示該患者是否屬于醫(yī)保欺詐人員,當(dāng)不屬于時(shí)為0,屬于則為1,將數(shù)據(jù)集劃分為訓(xùn)練集Train={(u,Yu)},驗(yàn)證集Val={(u,xu)},以及最終用于預(yù)測(cè)患者是否屬于醫(yī)保欺詐人員的概率的測(cè)試集,訓(xùn)練集、驗(yàn)證集、測(cè)試集三者比例為1-3:1:3-1;步驟S2具S2-1定義元路徑和多重語(yǔ)義路徑;S2-2選取基于元路徑和多重語(yǔ)義路徑的合適的鄰居,其中,S2-1包括元路徑表示成形式的路徑,其中.R描述了對(duì)象A?和A1+1之間的復(fù)合關(guān)系;多重路徑表示成式的路徑,其中MR=M?R?°M?R?°…°M?R?描述了對(duì)象A?和A?+1之間的復(fù)合關(guān)系,表示合成算符;S2-2包括:S2-2-1基于元路徑的鄰居集合,給定屬性異構(gòu)信息網(wǎng)絡(luò)中的用戶(hù)u,基于元路徑的鄰居被定義為AHIN中用戶(hù)u的給定元路徑下的聚合鄰居集;S2-2-2基于多重路徑采樣的鄰居集合,給定屬性異構(gòu)信息網(wǎng)絡(luò)中的用戶(hù)u,基于多重路徑采樣的鄰居被定義為AHIN中用戶(hù)u的給定多重路徑下的聚合鄰居集;S2-2-3構(gòu)建異構(gòu)子圖,通過(guò)元路徑和多重路徑分解成多個(gè)不同程度的子圖結(jié)構(gòu),記為;步驟S3包括:S3-1節(jié)點(diǎn)級(jí)別聚合;S3-2路徑級(jí)別聚合;S3-3子圖級(jí)別聚合,得到最終的節(jié)點(diǎn)嵌入Z;S3-4將最終的嵌入Z輸入多層感知機(jī)(MLP)進(jìn)行欺詐檢測(cè),應(yīng)用于不同的下游任務(wù),使用交叉熵作為損失函數(shù)(loss)通過(guò)反向傳播最小化函數(shù)來(lái)優(yōu)化模型權(quán)值,其中,S3-1-1給定通過(guò)路徑P連接的節(jié)點(diǎn)對(duì)(i,j),將重要性定義為E,基于路徑P的節(jié)點(diǎn)對(duì)3其中h;,h;分別代表的是節(jié)點(diǎn)i和節(jié)點(diǎn)j的嵌入,P代表的連接兩個(gè)節(jié)點(diǎn)的路徑,這里S3-1-3對(duì)節(jié)點(diǎn)i的基于元路徑或多重路徑的嵌入通過(guò)鄰居的投影特征與相應(yīng)的系數(shù)進(jìn)S3-2包括:定任務(wù)的路徑P的貢獻(xiàn)度,Hpi為特定任務(wù)的路徑Pi的嵌人表示;通過(guò)對(duì)變換后的路徑嵌S3-2-2將學(xué)習(xí)到子圖中每條路徑的的權(quán)重作為系數(shù),對(duì)所有路徑特定的嵌入進(jìn)行加權(quán)4S3-2-3單獨(dú)聚集每個(gè)子圖內(nèi)的指定路徑的嵌入,并生成n個(gè)子圖指定的向量嵌入,表示S3-3包括給定子圖特定的嵌入集合并加上不同子圖對(duì)于最終任務(wù)的重要性程度,表示如下:其中H表示子圖的重要性程度,91代表路徑級(jí)別的注意力向量,W?是權(quán)重矩陣,b?是索引的集合,Z1和Y是標(biāo)簽節(jié)點(diǎn)的嵌入和相應(yīng)的標(biāo)簽,W2.根據(jù)權(quán)利要求1所述的方法,其特征在于,S3-1-3中將節(jié)點(diǎn)級(jí)注意力機(jī)制重復(fù)K次,并將每次學(xué)習(xí)到的嵌入拼接起來(lái),得到在特定的子圖結(jié)構(gòu)中,給定路徑集{P??P?,…,Pm},鄰居節(jié)點(diǎn)的特征在經(jīng)過(guò)節(jié)點(diǎn)級(jí)注意力機(jī)制的學(xué)習(xí)后,得到m組路徑特定的節(jié)點(diǎn)嵌入表示,記作{h?,hp?…,hm.,o為L(zhǎng)eakyReLU。3.一種實(shí)現(xiàn)如權(quán)利要求1-2中任一項(xiàng)基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)于,所述服務(wù)器由多個(gè)相互獨(dú)立服務(wù)于不同醫(yī)療機(jī)構(gòu)的子服務(wù)器構(gòu)成,所述醫(yī)療機(jī)構(gòu)交易處理設(shè)備,包括設(shè)置在不同醫(yī)療機(jī)構(gòu)中的不同科室的至少一臺(tái)子交易處理設(shè)備,所述子至少一個(gè)客戶(hù)端與服務(wù)器之間,所述子服務(wù)器與至少一臺(tái)子交易處理設(shè)備之間相互通訊,其中,所述子服務(wù)器用于并保存接受客戶(hù)的交易請(qǐng)求歷史記錄,并通過(guò)子交易處理設(shè)備的檢測(cè)指令而完成所述基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè),并將檢測(cè)結(jié)果返回給子交易處理設(shè)備。4.一種非暫時(shí)性存儲(chǔ)介質(zhì),其特征在于,其中存儲(chǔ)有可由所述服務(wù)器運(yùn)行而實(shí)現(xiàn)實(shí)現(xiàn)5如權(quán)利要求1-2中任一項(xiàng)基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)方法的計(jì)算機(jī)可讀程序。6基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng)技術(shù)領(lǐng)域[0001]本發(fā)明涉及一種醫(yī)保欺詐檢測(cè)算法,涉及神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng),尤其涉及一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法及其系統(tǒng),屬于人工智能檢測(cè)領(lǐng)域。背景技術(shù)[0002]隨著醫(yī)療保險(xiǎn)的普及,在給人們就醫(yī)帶來(lái)極大便利的同時(shí),也給社會(huì)群眾提供了醫(yī)療保障。然而,我們也目睹了越來(lái)越多騙取醫(yī)療保險(xiǎn)基金的事件,全球每年都因醫(yī)保欺詐而損失大量醫(yī)?;?。傳統(tǒng)的醫(yī)保欺詐檢測(cè)方法為:1.基于規(guī)則的檢測(cè)方法。2.基于離群點(diǎn)的檢測(cè)方法。3.基于用戶(hù)統(tǒng)計(jì)特征的檢測(cè)方法。對(duì)于第一種方案來(lái)說(shuō),不僅依賴(lài)一定的先驗(yàn)爆炸性增長(zhǎng),領(lǐng)域?qū)<胰藬?shù)無(wú)法滿(mǎn)足現(xiàn)有欺詐案例篩查的需要,并且現(xiàn)在醫(yī)保欺詐的手段層出不窮,基于規(guī)則的難以處理復(fù)雜多變的模式。對(duì)于第二種方案來(lái)說(shuō),基于離群點(diǎn)的檢測(cè)方法主要是在固定模式下進(jìn)行的,隨著醫(yī)保制度的發(fā)展,醫(yī)保相關(guān)業(yè)務(wù)變得越來(lái)越細(xì)致,同時(shí)欺詐人員變得更加專(zhuān)業(yè)化,醫(yī)保欺詐行為復(fù)雜多變且具有隱蔽性。更為值得關(guān)注的是,新的欺詐模式也會(huì)不斷出現(xiàn),針對(duì)固定模式的異常檢測(cè)算法對(duì)新的欺詐模式缺乏免疫力,從固定模式發(fā)現(xiàn)欺詐行為的方法難以滿(mǎn)足現(xiàn)在的需求。對(duì)于第三種方案來(lái)說(shuō),對(duì)于標(biāo)簽數(shù)據(jù)的需求量較大,但是在實(shí)際場(chǎng)景中并沒(méi)有對(duì)數(shù)據(jù)做標(biāo)記,且只有較少的欺詐數(shù)據(jù)(患者隱私保護(hù))。[0003]事實(shí)上,欺詐性用戶(hù)不僅可能有異常的特征,而且在交互關(guān)系中的行為也是異常的。例如,一個(gè)醫(yī)保欺詐用戶(hù)可能同時(shí)在多家醫(yī)院有很多藥品交易,傳統(tǒng)的特征提取方式很難利用。傳統(tǒng)的醫(yī)保欺詐檢測(cè)方法無(wú)法充分利用用戶(hù)之間的交互關(guān)系,我們?cè)噲D利用其他領(lǐng)域的技術(shù)來(lái)解決上述問(wèn)題。[0004]異質(zhì)圖表示學(xué)習(xí)是建模這種實(shí)體間交互關(guān)系的有效方法之一,目前已經(jīng)被廣泛的運(yùn)用在電子商務(wù)的推薦系統(tǒng)、學(xué)術(shù)網(wǎng)絡(luò)分析、自然語(yǔ)言處理等領(lǐng)域。通過(guò)學(xué)習(xí)基于圖的表示,可以捕捉到結(jié)構(gòu)化數(shù)據(jù)的序列和拓?fù)浣Y(jié)構(gòu)、幾何和其他關(guān)系特征。已有的圖神經(jīng)網(wǎng)絡(luò)模型不是爭(zhēng)對(duì)特定問(wèn)題設(shè)計(jì)的,并不是特別適合來(lái)解決醫(yī)保欺詐問(wèn)題。因此,需要設(shè)計(jì)一個(gè)有效的針對(duì)醫(yī)保欺詐檢測(cè)的模型。發(fā)明內(nèi)容[0005]本發(fā)明主要是針對(duì)醫(yī)療保險(xiǎn)基金欺詐檢測(cè)問(wèn)題,提出了一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法。這種方法不僅只關(guān)注用戶(hù)的特征屬性,并且考慮了醫(yī)療過(guò)程中多次就診的行為屬性。醫(yī)療保險(xiǎn)欺詐者不僅有不尋常的特征,而且在這些互動(dòng)中也有不尋常的行為。[0006]具體地,一方面,本發(fā)明所述一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢7和藥物四個(gè)實(shí)體的節(jié)點(diǎn)),ε為關(guān)系集,X為信息矩陣,設(shè)患者節(jié)點(diǎn)集UcV,在數(shù)據(jù)集中每個(gè)患者u∈U都擁有一個(gè)標(biāo)簽Yu∈{0,1},表示該患者是否屬于醫(yī)保欺詐人員,當(dāng)不屬(簡(jiǎn)稱(chēng)A?A?A?…Az+1)形式的路徑,其中R=R?°R?°…°R?描述了對(duì)象A?和Az+1A?A?A?…A?+1)形式的路徑,其中MR=M?R?°M?R?°…°M?R描述了對(duì)象A?和Az+18處理(2),其中a。∈R2d9要性之后,步驟S3-1-3對(duì)節(jié)點(diǎn)i的基于元路徑或多重路徑的嵌入通過(guò)鄰居的投影特征與相在路徑P上學(xué)習(xí)到的嵌入表示,σ是激活函數(shù),優(yōu)選地σ為L(zhǎng)eakyReLU。在特定的子圖結(jié)構(gòu)中,給定路徑集{P?,P?,…;Pm},鄰居節(jié)點(diǎn)的特征在經(jīng)過(guò)節(jié)點(diǎn)級(jí)注意力到的與目標(biāo)患者同一科室就診的患者集合和同一天有過(guò)就診記錄的患者集合學(xué)習(xí)到的嵌代表的是特定子圖的嵌入,P={Pi?P?,,Pi}代表特定不同路徑不同的權(quán)重。我們首先通過(guò)對(duì)變換后的路徑嵌入與路徑級(jí)別注意力向量90的相一化的處理,那βpi可以通過(guò)如下公式得到1S3-2-2將學(xué)習(xí)到子圖中每條路徑的的權(quán)重作為系數(shù),對(duì)所有路徑特定的嵌入進(jìn)行加權(quán)求程,給定子圖特定的嵌入集合并加上不同子圖對(duì)于最終任務(wù)的重要性程度,表示如下:(01,,,0m)=Attsaiegr于是得到最終的節(jié)點(diǎn)嵌入(12)。S3-4中我們將最終的節(jié)點(diǎn)嵌入Z輸入多層感[0030]其中YL是具有標(biāo)簽的節(jié)點(diǎn)索引的集合,Z1、YL是標(biāo)簽節(jié)點(diǎn)的嵌入和相應(yīng)的標(biāo)欺詐者。[0031]步驟S4中欺詐醫(yī)療交易信息包括被檢測(cè)出的欺詐者的醫(yī)療交易所有實(shí)際的交易11[0032]本發(fā)明的第三個(gè)方面,是提供一種非暫時(shí)性存儲(chǔ)介質(zhì),其中存儲(chǔ)有可由所述服務(wù)器運(yùn)行而實(shí)現(xiàn)上述檢測(cè)算法的計(jì)算機(jī)可讀程序。[0033]本發(fā)明技術(shù)方案帶來(lái)的有益效果[0034](1)步驟1將醫(yī)保欺詐檢測(cè)問(wèn)題建模成AHIN中的分類(lèi)問(wèn)題,為解決醫(yī)保欺詐檢測(cè)問(wèn)題提供了理論基礎(chǔ)。[0035](2)步驟2定義了探索醫(yī)保AHIN結(jié)構(gòu)的語(yǔ)義路徑,挖掘AHIN中各個(gè)實(shí)體節(jié)點(diǎn)豐富交互關(guān)系,解決了一些醫(yī)保欺詐檢測(cè)方法忽略了多次就診的異常行為特征的問(wèn)題。[0036](3)步驟3使用多層注意力機(jī)制去聚合鄰居節(jié)點(diǎn)的信息和網(wǎng)絡(luò)的結(jié)構(gòu)信息,減少了噪聲節(jié)點(diǎn)和路徑對(duì)最終預(yù)測(cè)任務(wù)的影響。將聚合得到的最終嵌入用于預(yù)測(cè)用戶(hù)是否是醫(yī)保欺詐者。附圖說(shuō)明[0037]圖1元路徑(a)和多重路徑(b)定義示意圖,[0039]圖3不同數(shù)量的醫(yī)保欺詐者鄰居的用戶(hù)在不同元路徑PHP(左)和PtP(右)上欺詐率的提升百分比對(duì)比圖,[0040]圖4本發(fā)明實(shí)施例3中實(shí)現(xiàn)實(shí)施例2的檢測(cè)算法的系統(tǒng)。具體實(shí)施方式[0042]本實(shí)施例對(duì)于本發(fā)明的原理進(jìn)行說(shuō)明,一種基于多層注意力機(jī)制圖神經(jīng)網(wǎng)絡(luò)的醫(yī)保欺詐檢測(cè)算法,基本原理是利用AHIN建模真實(shí)醫(yī)保就醫(yī)場(chǎng)景,將醫(yī)療保險(xiǎn)欺詐檢測(cè)問(wèn)題其次,通過(guò)多層注意力機(jī)制將這些交互信息匯聚進(jìn)行學(xué)習(xí)。最后將學(xué)習(xí)到的嵌入表示信息輸入多層感知機(jī)(MLP)進(jìn)行欺詐檢測(cè),即本發(fā)明所提出的MHAMFD模型的完整內(nèi)容。表示學(xué)習(xí)算法將數(shù)據(jù)轉(zhuǎn)化成低維向量表示,我們采用基于語(yǔ)義路徑的方法抽取網(wǎng)絡(luò)中的結(jié)構(gòu)信息和豐富語(yǔ)義對(duì)數(shù)據(jù)進(jìn)行處理。[0044]S2-1中根據(jù)元路徑和多重語(yǔ)義路徑的定義,本實(shí)施例就醫(yī)保AHIN中元路徑和多重語(yǔ)義路徑的含義。如圖1(a)所示,我們構(gòu)建了一個(gè)AHIN來(lái)對(duì)發(fā)生醫(yī)保欺詐的就醫(yī)場(chǎng)景進(jìn)行(T)),具有豐富的屬性和關(guān)系。在AHIN中,兩個(gè)用戶(hù)可以通過(guò)多條元路徑連接,例如患者-科室-患者(P-K-P)、患者-藥物-患者(P-M-P)、患者-日期-患者(P-T-P)。不同的元路徑總是表達(dá)不同的語(yǔ)義。例如,路徑P-K-P表示該元路徑連接的兩個(gè)患者在同一個(gè)科室看過(guò)病。而路徑P-T-P表示該元路徑連接的兩個(gè)患者在同一天有過(guò)就診記錄。兩個(gè)用戶(hù)可以通過(guò)多條多重語(yǔ)義路徑連接。例如1(b),路徑P-(KT)-P表示該路徑連接的兩個(gè)患者同一天在同一個(gè)科室看過(guò)病。通過(guò)路徑P-(KTM)-P與目標(biāo)患者連接的表示與目標(biāo)患者同一天在同一個(gè)科室拿過(guò)同種藥品。[0045]異構(gòu)圖G中目標(biāo)節(jié)點(diǎn)表征的學(xué)習(xí)的關(guān)鍵在于如何準(zhǔn)確的傳播聚合鄰居的信息。我們基于上述的元路徑和多重語(yǔ)義路徑的定義去選取基于語(yǔ)義路徑合適的鄰居。[0046]S2-2中基于元路徑的鄰居集合以及基于多重路徑采樣的鄰居集合我們舉例來(lái)說(shuō)和基于多重路徑的鄰居都可以利用AHIN中不同方面的結(jié)構(gòu)信息。選取合適的節(jié)點(diǎn)之后,我們需要將這些鄰居節(jié)點(diǎn)的特征信息聚合并傳播給目標(biāo)節(jié)點(diǎn),用以學(xué)習(xí)目標(biāo)節(jié)點(diǎn)的最終嵌入表示。[0047]在S3中,我們首先對(duì)真實(shí)就醫(yī)場(chǎng)景和醫(yī)療數(shù)據(jù)進(jìn)行觀察,分析了基于元路徑和多重路徑的鄰居對(duì)基于真實(shí)數(shù)據(jù)的醫(yī)保欺詐人員檢測(cè)的影響,然后提出引入了一種基于多重注意機(jī)制的模型運(yùn)用于醫(yī)保欺詐檢測(cè)。我們?cè)趫D2中展示了該模型的總體結(jié)構(gòu)。首先,我們基于不同的元路徑和多重路徑聚合每個(gè)用戶(hù)的鄰居,以整合AHIN中多個(gè)方面的結(jié)構(gòu)信息去更好地進(jìn)行表示學(xué)習(xí)。在此基礎(chǔ)上,通過(guò)語(yǔ)義關(guān)注度區(qū)分元路徑和多重路徑的差異,得到特定任務(wù)特定語(yǔ)義節(jié)點(diǎn)嵌入的最優(yōu)加權(quán)組合。最后考慮不同的異構(gòu)子圖對(duì)于最終目的的重要性,我們對(duì)異構(gòu)子圖這一層也采用了注意力機(jī)制學(xué)習(xí)不同子圖的偏好。[0048]對(duì)于真實(shí)醫(yī)保欺詐事件以及數(shù)據(jù)集觀察可以看出,醫(yī)保欺詐人員通常更傾向于團(tuán)隊(duì)作案,這些人員通過(guò)不同類(lèi)型的交互緊密的聚合在一起。醫(yī)保欺詐人員更傾向于呈團(tuán)隊(duì)性地在同一家醫(yī)院進(jìn)行就醫(yī)或者同一時(shí)間段留下醫(yī)療記錄。為了驗(yàn)證不同交互關(guān)系下的醫(yī)保欺詐人員的聚合情況,我們?cè)谡鎸?shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。我們首先基于兩條元路徑P-K-P和P-T-P收集每個(gè)患者基于元路徑的鄰居(基于路徑P-K-P的鄰居表示在同一個(gè)科室看過(guò)病的患者,基于路徑P-KT-P的鄰居表示在同一天同一科室看過(guò)病的患者),我們統(tǒng)計(jì)欺詐人員的數(shù)量。并根據(jù)不同的路徑分為多個(gè)組,計(jì)算每個(gè)小組的欺詐人員的比例。如圖3,通過(guò)觀察結(jié)果表示不同的基于元路徑的鄰居對(duì)患者的影響程度不同??梢钥吹讲煌恼Z(yǔ)義路徑對(duì)于患者有不同的重要性,因此我們采用注意力機(jī)制去捕獲這些不同的重要性。[0049]實(shí)施例2[0050]本實(shí)施例是在不考慮時(shí)期效應(yīng)情況下的測(cè)試結(jié)果,我們使用了某市醫(yī)保局2018年的真實(shí)數(shù)據(jù)集。Medical-1數(shù)據(jù)集的欺詐樣本是相是通過(guò)腎臟疾病異常、重復(fù)開(kāi)藥、80后開(kāi)老年癡呆藥、門(mén)診同時(shí)住院等方法發(fā)現(xiàn)的異?;颊摺2煌氖?,Medical-1是一個(gè)平衡樣本,正負(fù)樣本的比例是1:2。具體信息見(jiàn)表1。平衡樣本節(jié)點(diǎn)的分類(lèi)效果見(jiàn)表2。平衡樣本節(jié)點(diǎn)的異常檢測(cè)效果見(jiàn)表3。不同的訓(xùn)練集分配下都顯示出最佳的性能。這表明,MHAMFD模型可以更好地學(xué)習(xí)真實(shí)醫(yī)療保險(xiǎn)數(shù)據(jù)之間的語(yǔ)義信息,并將其用于欺詐檢測(cè)。首先,基于圖結(jié)構(gòu)的異質(zhì)圖嵌入方法,如Metapath2vec,在一定程度上包含了網(wǎng)絡(luò)結(jié)構(gòu)信息,但忽略了節(jié)點(diǎn)的特征信息,所以性能相和MHAMFD還引入了一個(gè)注意力機(jī)制來(lái)評(píng)估圖中對(duì)象的重要性,以提高嵌入表示的性能。此使用元路徑和多路徑來(lái)捕捉異構(gòu)圖中更復(fù)雜的語(yǔ)義信息,聚合更復(fù)雜的鄰域信息,并考慮不同層次的子圖結(jié)構(gòu)對(duì)節(jié)點(diǎn)嵌入的影響。MHAMFD使用元路徑和多路徑方法將異構(gòu)圖分解為不同層次的多個(gè)子圖,考慮了元路徑交織帶來(lái)的復(fù)合語(yǔ)義關(guān)系,提高了目標(biāo)節(jié)點(diǎn)鄰域的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論