基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究_第1頁
基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究_第2頁
基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究_第3頁
基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究_第4頁
基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究(江景星、向晴、何澤煬摘要:針對(duì)醫(yī)療保險(xiǎn)領(lǐng)域中的詐騙行為,通過數(shù)據(jù)挖掘的方法,從大量數(shù)據(jù)中尋找規(guī)律,從而發(fā)現(xiàn)醫(yī)保數(shù)據(jù)中潛在的信息,篩選出詐騙人員。本文利用聚類分析得到主體變量,用模糊層次分析求得評(píng)價(jià)系數(shù),并用熵值法確定標(biāo)準(zhǔn)值,從而篩選出騙保嫌疑人,最終用支持向量機(jī)方法檢驗(yàn)?zāi)P褪欠窈侠?。本文通過算例說明了該方法的應(yīng)用,以期輔助醫(yī)保安全運(yùn)營(yíng)和風(fēng)險(xiǎn)防控,達(dá)到完善現(xiàn)代醫(yī)?;疬\(yùn)營(yíng)體系的目的。關(guān)鍵詞:聚類分析 模糊層次分析法 二分法 支持向量機(jī) 一、 引言醫(yī)療保險(xiǎn)欺詐,是指公民故意捏造事實(shí)、弄虛作假、隱瞞真實(shí)情況等造成醫(yī)療保險(xiǎn)基金損失的行為。騙保人進(jìn)行醫(yī)保欺詐時(shí)通常使用

2、的手段有:1.拿著別人的醫(yī)??ㄅ渌?;2.在不同的醫(yī)院和醫(yī)生處重復(fù)配藥。具體表現(xiàn)為:1.進(jìn)行單張?zhí)幏剿庂M(fèi)特別高;2.一張卡在一定時(shí)間內(nèi)反復(fù)多次拿藥。二、 醫(yī)保詐騙篩選模型研究(一)模型建立1.變量處理簡(jiǎn)單剔除無用變量后,運(yùn)用聚類分析法進(jìn)行降維處理。采用系統(tǒng)聚類法2,對(duì)變量進(jìn)行分類,即將n項(xiàng)指標(biāo)看成n類,根據(jù)指標(biāo)變量的親疏程度,將親疏程度最高的兩類進(jìn)行合并,然后考慮合并后的類與其他類之間的親疏程度,再進(jìn)行合并。重復(fù)這一過程,直到將所有的指標(biāo)合并為一類。(1計(jì)算向量間的距離:;為樣本數(shù)據(jù)矩陣的協(xié)方差陣。(2刻畫類的特征:平均距離;(3將平均距離最小的類歸為一類。(4根據(jù)需要,選取變量。2.模糊層次分

3、析法對(duì)詐騙可能性評(píng)價(jià)構(gòu)建病人醫(yī)保詐騙評(píng)價(jià)指標(biāo)層次結(jié)構(gòu)模型,在此基礎(chǔ)上運(yùn)用模糊層次分析及熵值法計(jì)算各指標(biāo)的相對(duì)權(quán)重,然后綜合運(yùn)用模糊綜合評(píng)價(jià)方法以及層次分析法的層次結(jié)構(gòu)建立的評(píng)價(jià)指標(biāo)體系3,對(duì)病人醫(yī)保欺詐情況做出定量的綜合評(píng)價(jià)。熵值賦權(quán)法求權(quán)重:(1建立評(píng)價(jià)系統(tǒng)的初始數(shù)據(jù)矩陣: (2數(shù)據(jù)標(biāo)準(zhǔn)化處理: ,表示標(biāo)準(zhǔn)化后的值。計(jì)算第項(xiàng)指標(biāo)下第個(gè)樣品的比重:由此得到數(shù)據(jù)的比重矩陣:(3計(jì)算指標(biāo)信息熵值和信息效用值:計(jì)算第項(xiàng)指標(biāo)的信息熵值:,得到結(jié)果:其中,為波爾茲曼常數(shù),;本文中;信息效用價(jià)值取決于該指標(biāo)的信息熵與1之間的差值,越大,權(quán)重越大:,得到信息效用價(jià)值:;計(jì)算評(píng)價(jià)指標(biāo)權(quán)重:利用熵值法估計(jì)指標(biāo)權(quán)

4、重,本質(zhì)是利用該指標(biāo)信息的價(jià)值系數(shù)計(jì)算,價(jià)值系數(shù)越高,對(duì)評(píng)價(jià)的重要性就越大。第項(xiàng)指標(biāo)的權(quán)重為:。計(jì)算得到綜合指標(biāo):綜合指標(biāo)為:。3.利用二分法確定標(biāo)準(zhǔn)值醫(yī)保詐騙相對(duì)具有共性,特征明顯如下圖,故存在明顯分界點(diǎn),即所求標(biāo)準(zhǔn)值。利用二分法查找特殊標(biāo)準(zhǔn)值:二分法:對(duì)所有病人評(píng)價(jià)系數(shù)按從小到大順序排列,將其從中間分割為兩個(gè)區(qū)段,必存在T,使得Number1k,k+1,high>T,令新的區(qū)間為Number2low,,K-1 將其交界處分割點(diǎn)作為標(biāo)準(zhǔn)點(diǎn) 繼續(xù)選取 。 4.比對(duì)得到可能詐騙的病人ID將綜合指標(biāo)與進(jìn)行比較,得到詐騙者ID號(hào)。(二)支持向量機(jī)模擬檢驗(yàn)將病人騙保與非騙保看做對(duì)病人類型的分類,

5、以所得結(jié)論作為訓(xùn)練樣本,每個(gè)標(biāo)記為屬于兩類,對(duì)兩兩分類變量分別進(jìn)行支持向量機(jī)分析4,得出分類曲線,將數(shù)據(jù)區(qū)分開,觀察不同區(qū)域病人騙保情況,如果發(fā)現(xiàn)兩類病人較為明顯的區(qū)分在分類線兩側(cè),則認(rèn)為模型預(yù)測(cè)數(shù)據(jù)較為準(zhǔn)確。利用R軟件建立支持向量線性模擬檢測(cè)器,對(duì)分類結(jié)果進(jìn)行檢驗(yàn),繪制圖形如下。通過上述圖像定性分析,圈點(diǎn)和差點(diǎn)基本分布在分類線兩側(cè),檢測(cè)器找到一條支持向量檢測(cè)線很好地將兩類數(shù)據(jù)分開,區(qū)分情況與我們先前推測(cè)的結(jié)果基本符合,由此得出結(jié)論在一定誤差范圍內(nèi),一維支持向量機(jī)模型可以很好區(qū)分不同類別病人,該數(shù)學(xué)模型具有較高的準(zhǔn)確性與科學(xué)性。三、 結(jié)果分析運(yùn)用模糊層次分析法進(jìn)行分析,采用熵值法,根據(jù)各項(xiàng)指標(biāo)觀測(cè)值所提供的信息的大小確定出不同指標(biāo)的對(duì)應(yīng)權(quán)重,購藥總花費(fèi)系數(shù)<購藥頻數(shù)系數(shù)<開囑醫(yī)生數(shù)目系數(shù),開囑醫(yī)生數(shù)目所占權(quán)重最大,可以預(yù)測(cè)大多數(shù)詐騙人員都具有開囑醫(yī)生多的特點(diǎn),對(duì)于這一類病人應(yīng)進(jìn)行重點(diǎn)排查,防止詐騙行為的發(fā)生。最后得出疑似欺詐病例,其主要特點(diǎn)是購藥花費(fèi)大、買藥次數(shù)多、開囑醫(yī)生多,可見前期變量選擇準(zhǔn)確,可以很好反映欺詐病人特點(diǎn),醫(yī)院可以從這三方面入手加強(qiáng)監(jiān)管力度,發(fā)現(xiàn)潛在的醫(yī)保欺詐病人,一旦查出欺詐病人則吊銷其醫(yī)??ㄌ?hào),嚴(yán)厲打擊醫(yī)保騙保行為。本文在最后依據(jù)有監(jiān)督學(xué)習(xí)原理,引入支持向量機(jī)線性模擬器,判斷推

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論