CN114463141B 基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)(廈門理工學院)_第1頁
CN114463141B 基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)(廈門理工學院)_第2頁
CN114463141B 基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)(廈門理工學院)_第3頁
CN114463141B 基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)(廈門理工學院)_第4頁
CN114463141B 基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)(廈門理工學院)_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

(19)國家知識產(chǎn)權局(12)發(fā)明專利(10)授權公告號CN114463141B(65)同一申請的已公布的文獻號(73)專利權人廈門理工學院地址361024福建省廈門市集美區(qū)理工路600號(72)發(fā)明人林開標陸江濤張楊盧萍(74)專利代理機構廈門智慧呈睿知識產(chǎn)權代理事務所(普通合伙)35222專利代理師陳曉思審查員王箭(54)發(fā)明名稱基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)本發(fā)明涉及一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法,包含下述步驟:S1建立醫(yī)療保險欺詐檢測AHIN模型;S2選取語義路徑并尋找鄰居節(jié)點;S3構建基于圖神經(jīng)網(wǎng)絡的檢挖掘了AHIN中各個實體節(jié)點豐富交互關系,解決了一些醫(yī)保欺詐檢測方法忽略了多次就診的異常行為特征的問題,同時減少了噪聲節(jié)點、路徑_Z_21.一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測方法,包含下述步驟:S2選取語義路徑并尋找鄰居節(jié)點;S3構建基于圖神經(jīng)網(wǎng)絡的檢測MHAMFD模型;S1-1對患者的所有就診記錄抽取出來,并從中構建患者、醫(yī)院科室、日期和藥物四個實S1-2通過對真實就醫(yī)場景中的不同類型對象及其相互作用建模成AHIN,表示為異構圖G={V,ε,X},其中V為不同類型對象集,即包括患者、醫(yī)院科室、日期和藥物四個實體的設患者節(jié)點集UCV,對于數(shù)據(jù)集中每個患者u∈U都擁有一個標簽Yu∈{0,1},表示該患者是否屬于醫(yī)保欺詐人員,當不屬于時為0,屬于則為1,將數(shù)據(jù)集劃分為訓練集Train={(u,Yu)},驗證集Val={(u,xu)},以及最終用于預測患者是否屬于醫(yī)保欺詐人員的概率的測試集,訓練集、驗證集、測試集三者比例為1-3:1:3-1;步驟S2具S2-1定義元路徑和多重語義路徑;S2-2選取基于元路徑和多重語義路徑的合適的鄰居,其中,S2-1包括元路徑表示成形式的路徑,其中.R描述了對象A?和A1+1之間的復合關系;多重路徑表示成式的路徑,其中MR=M?R?°M?R?°…°M?R?描述了對象A?和A?+1之間的復合關系,表示合成算符;S2-2包括:S2-2-1基于元路徑的鄰居集合,給定屬性異構信息網(wǎng)絡中的用戶u,基于元路徑的鄰居被定義為AHIN中用戶u的給定元路徑下的聚合鄰居集;S2-2-2基于多重路徑采樣的鄰居集合,給定屬性異構信息網(wǎng)絡中的用戶u,基于多重路徑采樣的鄰居被定義為AHIN中用戶u的給定多重路徑下的聚合鄰居集;S2-2-3構建異構子圖,通過元路徑和多重路徑分解成多個不同程度的子圖結構,記為;步驟S3包括:S3-1節(jié)點級別聚合;S3-2路徑級別聚合;S3-3子圖級別聚合,得到最終的節(jié)點嵌入Z;S3-4將最終的嵌入Z輸入多層感知機(MLP)進行欺詐檢測,應用于不同的下游任務,使用交叉熵作為損失函數(shù)(loss)通過反向傳播最小化函數(shù)來優(yōu)化模型權值,其中,S3-1-1給定通過路徑P連接的節(jié)點對(i,j),將重要性定義為E,基于路徑P的節(jié)點對3其中h;,h;分別代表的是節(jié)點i和節(jié)點j的嵌入,P代表的連接兩個節(jié)點的路徑,這里S3-1-3對節(jié)點i的基于元路徑或多重路徑的嵌入通過鄰居的投影特征與相應的系數(shù)進S3-2包括:定任務的路徑P的貢獻度,Hpi為特定任務的路徑Pi的嵌人表示;通過對變換后的路徑嵌S3-2-2將學習到子圖中每條路徑的的權重作為系數(shù),對所有路徑特定的嵌入進行加權4S3-2-3單獨聚集每個子圖內(nèi)的指定路徑的嵌入,并生成n個子圖指定的向量嵌入,表示S3-3包括給定子圖特定的嵌入集合并加上不同子圖對于最終任務的重要性程度,表示如下:其中H表示子圖的重要性程度,91代表路徑級別的注意力向量,W?是權重矩陣,b?是索引的集合,Z1和Y是標簽節(jié)點的嵌入和相應的標簽,W2.根據(jù)權利要求1所述的方法,其特征在于,S3-1-3中將節(jié)點級注意力機制重復K次,并將每次學習到的嵌入拼接起來,得到在特定的子圖結構中,給定路徑集{P??P?,…,Pm},鄰居節(jié)點的特征在經(jīng)過節(jié)點級注意力機制的學習后,得到m組路徑特定的節(jié)點嵌入表示,記作{h?,hp?…,hm.,o為LeakyReLU。3.一種實現(xiàn)如權利要求1-2中任一項基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測于,所述服務器由多個相互獨立服務于不同醫(yī)療機構的子服務器構成,所述醫(yī)療機構交易處理設備,包括設置在不同醫(yī)療機構中的不同科室的至少一臺子交易處理設備,所述子至少一個客戶端與服務器之間,所述子服務器與至少一臺子交易處理設備之間相互通訊,其中,所述子服務器用于并保存接受客戶的交易請求歷史記錄,并通過子交易處理設備的檢測指令而完成所述基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測,并將檢測結果返回給子交易處理設備。4.一種非暫時性存儲介質(zhì),其特征在于,其中存儲有可由所述服務器運行而實現(xiàn)實現(xiàn)5如權利要求1-2中任一項基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測方法的計算機可讀程序。6基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng)技術領域[0001]本發(fā)明涉及一種醫(yī)保欺詐檢測算法,涉及神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng),尤其涉及一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法及其系統(tǒng),屬于人工智能檢測領域。背景技術[0002]隨著醫(yī)療保險的普及,在給人們就醫(yī)帶來極大便利的同時,也給社會群眾提供了醫(yī)療保障。然而,我們也目睹了越來越多騙取醫(yī)療保險基金的事件,全球每年都因醫(yī)保欺詐而損失大量醫(yī)?;?。傳統(tǒng)的醫(yī)保欺詐檢測方法為:1.基于規(guī)則的檢測方法。2.基于離群點的檢測方法。3.基于用戶統(tǒng)計特征的檢測方法。對于第一種方案來說,不僅依賴一定的先驗爆炸性增長,領域專家人數(shù)無法滿足現(xiàn)有欺詐案例篩查的需要,并且現(xiàn)在醫(yī)保欺詐的手段層出不窮,基于規(guī)則的難以處理復雜多變的模式。對于第二種方案來說,基于離群點的檢測方法主要是在固定模式下進行的,隨著醫(yī)保制度的發(fā)展,醫(yī)保相關業(yè)務變得越來越細致,同時欺詐人員變得更加專業(yè)化,醫(yī)保欺詐行為復雜多變且具有隱蔽性。更為值得關注的是,新的欺詐模式也會不斷出現(xiàn),針對固定模式的異常檢測算法對新的欺詐模式缺乏免疫力,從固定模式發(fā)現(xiàn)欺詐行為的方法難以滿足現(xiàn)在的需求。對于第三種方案來說,對于標簽數(shù)據(jù)的需求量較大,但是在實際場景中并沒有對數(shù)據(jù)做標記,且只有較少的欺詐數(shù)據(jù)(患者隱私保護)。[0003]事實上,欺詐性用戶不僅可能有異常的特征,而且在交互關系中的行為也是異常的。例如,一個醫(yī)保欺詐用戶可能同時在多家醫(yī)院有很多藥品交易,傳統(tǒng)的特征提取方式很難利用。傳統(tǒng)的醫(yī)保欺詐檢測方法無法充分利用用戶之間的交互關系,我們試圖利用其他領域的技術來解決上述問題。[0004]異質(zhì)圖表示學習是建模這種實體間交互關系的有效方法之一,目前已經(jīng)被廣泛的運用在電子商務的推薦系統(tǒng)、學術網(wǎng)絡分析、自然語言處理等領域。通過學習基于圖的表示,可以捕捉到結構化數(shù)據(jù)的序列和拓撲結構、幾何和其他關系特征。已有的圖神經(jīng)網(wǎng)絡模型不是爭對特定問題設計的,并不是特別適合來解決醫(yī)保欺詐問題。因此,需要設計一個有效的針對醫(yī)保欺詐檢測的模型。發(fā)明內(nèi)容[0005]本發(fā)明主要是針對醫(yī)療保險基金欺詐檢測問題,提出了一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法。這種方法不僅只關注用戶的特征屬性,并且考慮了醫(yī)療過程中多次就診的行為屬性。醫(yī)療保險欺詐者不僅有不尋常的特征,而且在這些互動中也有不尋常的行為。[0006]具體地,一方面,本發(fā)明所述一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢7和藥物四個實體的節(jié)點),ε為關系集,X為信息矩陣,設患者節(jié)點集UcV,在數(shù)據(jù)集中每個患者u∈U都擁有一個標簽Yu∈{0,1},表示該患者是否屬于醫(yī)保欺詐人員,當不屬(簡稱A?A?A?…Az+1)形式的路徑,其中R=R?°R?°…°R?描述了對象A?和Az+1A?A?A?…A?+1)形式的路徑,其中MR=M?R?°M?R?°…°M?R描述了對象A?和Az+18處理(2),其中a?!蔙2d9要性之后,步驟S3-1-3對節(jié)點i的基于元路徑或多重路徑的嵌入通過鄰居的投影特征與相在路徑P上學習到的嵌入表示,σ是激活函數(shù),優(yōu)選地σ為LeakyReLU。在特定的子圖結構中,給定路徑集{P?,P?,…;Pm},鄰居節(jié)點的特征在經(jīng)過節(jié)點級注意力到的與目標患者同一科室就診的患者集合和同一天有過就診記錄的患者集合學習到的嵌代表的是特定子圖的嵌入,P={Pi?P?,,Pi}代表特定不同路徑不同的權重。我們首先通過對變換后的路徑嵌入與路徑級別注意力向量90的相一化的處理,那βpi可以通過如下公式得到1S3-2-2將學習到子圖中每條路徑的的權重作為系數(shù),對所有路徑特定的嵌入進行加權求程,給定子圖特定的嵌入集合并加上不同子圖對于最終任務的重要性程度,表示如下:(01,,,0m)=Attsaiegr于是得到最終的節(jié)點嵌入(12)。S3-4中我們將最終的節(jié)點嵌入Z輸入多層感[0030]其中YL是具有標簽的節(jié)點索引的集合,Z1、YL是標簽節(jié)點的嵌入和相應的標欺詐者。[0031]步驟S4中欺詐醫(yī)療交易信息包括被檢測出的欺詐者的醫(yī)療交易所有實際的交易11[0032]本發(fā)明的第三個方面,是提供一種非暫時性存儲介質(zhì),其中存儲有可由所述服務器運行而實現(xiàn)上述檢測算法的計算機可讀程序。[0033]本發(fā)明技術方案帶來的有益效果[0034](1)步驟1將醫(yī)保欺詐檢測問題建模成AHIN中的分類問題,為解決醫(yī)保欺詐檢測問題提供了理論基礎。[0035](2)步驟2定義了探索醫(yī)保AHIN結構的語義路徑,挖掘AHIN中各個實體節(jié)點豐富交互關系,解決了一些醫(yī)保欺詐檢測方法忽略了多次就診的異常行為特征的問題。[0036](3)步驟3使用多層注意力機制去聚合鄰居節(jié)點的信息和網(wǎng)絡的結構信息,減少了噪聲節(jié)點和路徑對最終預測任務的影響。將聚合得到的最終嵌入用于預測用戶是否是醫(yī)保欺詐者。附圖說明[0037]圖1元路徑(a)和多重路徑(b)定義示意圖,[0039]圖3不同數(shù)量的醫(yī)保欺詐者鄰居的用戶在不同元路徑PHP(左)和PtP(右)上欺詐率的提升百分比對比圖,[0040]圖4本發(fā)明實施例3中實現(xiàn)實施例2的檢測算法的系統(tǒng)。具體實施方式[0042]本實施例對于本發(fā)明的原理進行說明,一種基于多層注意力機制圖神經(jīng)網(wǎng)絡的醫(yī)保欺詐檢測算法,基本原理是利用AHIN建模真實醫(yī)保就醫(yī)場景,將醫(yī)療保險欺詐檢測問題其次,通過多層注意力機制將這些交互信息匯聚進行學習。最后將學習到的嵌入表示信息輸入多層感知機(MLP)進行欺詐檢測,即本發(fā)明所提出的MHAMFD模型的完整內(nèi)容。表示學習算法將數(shù)據(jù)轉化成低維向量表示,我們采用基于語義路徑的方法抽取網(wǎng)絡中的結構信息和豐富語義對數(shù)據(jù)進行處理。[0044]S2-1中根據(jù)元路徑和多重語義路徑的定義,本實施例就醫(yī)保AHIN中元路徑和多重語義路徑的含義。如圖1(a)所示,我們構建了一個AHIN來對發(fā)生醫(yī)保欺詐的就醫(yī)場景進行(T)),具有豐富的屬性和關系。在AHIN中,兩個用戶可以通過多條元路徑連接,例如患者-科室-患者(P-K-P)、患者-藥物-患者(P-M-P)、患者-日期-患者(P-T-P)。不同的元路徑總是表達不同的語義。例如,路徑P-K-P表示該元路徑連接的兩個患者在同一個科室看過病。而路徑P-T-P表示該元路徑連接的兩個患者在同一天有過就診記錄。兩個用戶可以通過多條多重語義路徑連接。例如1(b),路徑P-(KT)-P表示該路徑連接的兩個患者同一天在同一個科室看過病。通過路徑P-(KTM)-P與目標患者連接的表示與目標患者同一天在同一個科室拿過同種藥品。[0045]異構圖G中目標節(jié)點表征的學習的關鍵在于如何準確的傳播聚合鄰居的信息。我們基于上述的元路徑和多重語義路徑的定義去選取基于語義路徑合適的鄰居。[0046]S2-2中基于元路徑的鄰居集合以及基于多重路徑采樣的鄰居集合我們舉例來說和基于多重路徑的鄰居都可以利用AHIN中不同方面的結構信息。選取合適的節(jié)點之后,我們需要將這些鄰居節(jié)點的特征信息聚合并傳播給目標節(jié)點,用以學習目標節(jié)點的最終嵌入表示。[0047]在S3中,我們首先對真實就醫(yī)場景和醫(yī)療數(shù)據(jù)進行觀察,分析了基于元路徑和多重路徑的鄰居對基于真實數(shù)據(jù)的醫(yī)保欺詐人員檢測的影響,然后提出引入了一種基于多重注意機制的模型運用于醫(yī)保欺詐檢測。我們在圖2中展示了該模型的總體結構。首先,我們基于不同的元路徑和多重路徑聚合每個用戶的鄰居,以整合AHIN中多個方面的結構信息去更好地進行表示學習。在此基礎上,通過語義關注度區(qū)分元路徑和多重路徑的差異,得到特定任務特定語義節(jié)點嵌入的最優(yōu)加權組合。最后考慮不同的異構子圖對于最終目的的重要性,我們對異構子圖這一層也采用了注意力機制學習不同子圖的偏好。[0048]對于真實醫(yī)保欺詐事件以及數(shù)據(jù)集觀察可以看出,醫(yī)保欺詐人員通常更傾向于團隊作案,這些人員通過不同類型的交互緊密的聚合在一起。醫(yī)保欺詐人員更傾向于呈團隊性地在同一家醫(yī)院進行就醫(yī)或者同一時間段留下醫(yī)療記錄。為了驗證不同交互關系下的醫(yī)保欺詐人員的聚合情況,我們在真實數(shù)據(jù)集上進行實驗。我們首先基于兩條元路徑P-K-P和P-T-P收集每個患者基于元路徑的鄰居(基于路徑P-K-P的鄰居表示在同一個科室看過病的患者,基于路徑P-KT-P的鄰居表示在同一天同一科室看過病的患者),我們統(tǒng)計欺詐人員的數(shù)量。并根據(jù)不同的路徑分為多個組,計算每個小組的欺詐人員的比例。如圖3,通過觀察結果表示不同的基于元路徑的鄰居對患者的影響程度不同??梢钥吹讲煌恼Z義路徑對于患者有不同的重要性,因此我們采用注意力機制去捕獲這些不同的重要性。[0049]實施例2[0050]本實施例是在不考慮時期效應情況下的測試結果,我們使用了某市醫(yī)保局2018年的真實數(shù)據(jù)集。Medical-1數(shù)據(jù)集的欺詐樣本是相是通過腎臟疾病異常、重復開藥、80后開老年癡呆藥、門診同時住院等方法發(fā)現(xiàn)的異常患者。不同的是,Medical-1是一個平衡樣本,正負樣本的比例是1:2。具體信息見表1。平衡樣本節(jié)點的分類效果見表2。平衡樣本節(jié)點的異常檢測效果見表3。不同的訓練集分配下都顯示出最佳的性能。這表明,MHAMFD模型可以更好地學習真實醫(yī)療保險數(shù)據(jù)之間的語義信息,并將其用于欺詐檢測。首先,基于圖結構的異質(zhì)圖嵌入方法,如Metapath2vec,在一定程度上包含了網(wǎng)絡結構信息,但忽略了節(jié)點的特征信息,所以性能相和MHAMFD還引入了一個注意力機制來評估圖中對象的重要性,以提高嵌入表示的性能。此使用元路徑和多路徑來捕捉異構圖中更復雜的語義信息,聚合更復雜的鄰域信息,并考慮不同層次的子圖結構對節(jié)點嵌入的影響。MHAMFD使用元路徑和多路徑方法將異構圖分解為不同層次的多個子圖,考慮了元路徑交織帶來的復合語義關系,提高了目標節(jié)點鄰域的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論