版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于數(shù)據(jù)挖掘的醫(yī)保詐騙篩選模型研究(江景星、向晴、何澤煬摘要:針對(duì)醫(yī)療保險(xiǎn)領(lǐng)域中的詐騙行為,通過數(shù)據(jù)挖掘的方法,從大量數(shù)據(jù)中尋找規(guī)律,從而發(fā)現(xiàn)醫(yī)保數(shù)據(jù)中潛在的信息,篩選出詐騙人員。本文利用聚類分析得到主體變量,用模糊層次分析求得評(píng)價(jià)系數(shù),并用熵值法確定標(biāo)準(zhǔn)值,從而篩選出騙保嫌疑人,最終用支持向量機(jī)方法檢驗(yàn)?zāi)P褪欠窈侠?。本文通過算例說明了該方法的應(yīng)用,以期輔助醫(yī)保安全運(yùn)營(yíng)和風(fēng)險(xiǎn)防控,達(dá)到完善現(xiàn)代醫(yī)?;疬\(yùn)營(yíng)體系的目的。關(guān)鍵詞:聚類分析 模糊層次分析法 二分法 支持向量機(jī) 一、 引言醫(yī)療保險(xiǎn)欺詐,是指公民故意捏造事實(shí)、弄虛作假、隱瞞真實(shí)情況等造成醫(yī)療保險(xiǎn)基金損失的行為。騙保人進(jìn)行醫(yī)保欺詐時(shí)通常使用
2、的手段有:1.拿著別人的醫(yī)??ㄅ渌?;2.在不同的醫(yī)院和醫(yī)生處重復(fù)配藥。具體表現(xiàn)為:1.進(jìn)行單張?zhí)幏剿庂M(fèi)特別高;2.一張卡在一定時(shí)間內(nèi)反復(fù)多次拿藥。二、 醫(yī)保詐騙篩選模型研究(一)模型建立1.變量處理簡(jiǎn)單剔除無用變量后,運(yùn)用聚類分析法進(jìn)行降維處理。采用系統(tǒng)聚類法2,對(duì)變量進(jìn)行分類,即將n項(xiàng)指標(biāo)看成n類,根據(jù)指標(biāo)變量的親疏程度,將親疏程度最高的兩類進(jìn)行合并,然后考慮合并后的類與其他類之間的親疏程度,再進(jìn)行合并。重復(fù)這一過程,直到將所有的指標(biāo)合并為一類。(1計(jì)算向量間的距離:;為樣本數(shù)據(jù)矩陣的協(xié)方差陣。(2刻畫類的特征:平均距離;(3將平均距離最小的類歸為一類。(4根據(jù)需要,選取變量。2.模糊層次分
3、析法對(duì)詐騙可能性評(píng)價(jià)構(gòu)建病人醫(yī)保詐騙評(píng)價(jià)指標(biāo)層次結(jié)構(gòu)模型,在此基礎(chǔ)上運(yùn)用模糊層次分析及熵值法計(jì)算各指標(biāo)的相對(duì)權(quán)重,然后綜合運(yùn)用模糊綜合評(píng)價(jià)方法以及層次分析法的層次結(jié)構(gòu)建立的評(píng)價(jià)指標(biāo)體系3,對(duì)病人醫(yī)保欺詐情況做出定量的綜合評(píng)價(jià)。熵值賦權(quán)法求權(quán)重:(1建立評(píng)價(jià)系統(tǒng)的初始數(shù)據(jù)矩陣: (2數(shù)據(jù)標(biāo)準(zhǔn)化處理: ,表示標(biāo)準(zhǔn)化后的值。計(jì)算第項(xiàng)指標(biāo)下第個(gè)樣品的比重:由此得到數(shù)據(jù)的比重矩陣:(3計(jì)算指標(biāo)信息熵值和信息效用值:計(jì)算第項(xiàng)指標(biāo)的信息熵值:,得到結(jié)果:其中,為波爾茲曼常數(shù),;本文中;信息效用價(jià)值取決于該指標(biāo)的信息熵與1之間的差值,越大,權(quán)重越大:,得到信息效用價(jià)值:;計(jì)算評(píng)價(jià)指標(biāo)權(quán)重:利用熵值法估計(jì)指標(biāo)權(quán)
4、重,本質(zhì)是利用該指標(biāo)信息的價(jià)值系數(shù)計(jì)算,價(jià)值系數(shù)越高,對(duì)評(píng)價(jià)的重要性就越大。第項(xiàng)指標(biāo)的權(quán)重為:。計(jì)算得到綜合指標(biāo):綜合指標(biāo)為:。3.利用二分法確定標(biāo)準(zhǔn)值醫(yī)保詐騙相對(duì)具有共性,特征明顯如下圖,故存在明顯分界點(diǎn),即所求標(biāo)準(zhǔn)值。利用二分法查找特殊標(biāo)準(zhǔn)值:二分法:對(duì)所有病人評(píng)價(jià)系數(shù)按從小到大順序排列,將其從中間分割為兩個(gè)區(qū)段,必存在T,使得Number1k,k+1,high>T,令新的區(qū)間為Number2low,,K-1 將其交界處分割點(diǎn)作為標(biāo)準(zhǔn)點(diǎn) 繼續(xù)選取 。 4.比對(duì)得到可能詐騙的病人ID將綜合指標(biāo)與進(jìn)行比較,得到詐騙者ID號(hào)。(二)支持向量機(jī)模擬檢驗(yàn)將病人騙保與非騙保看做對(duì)病人類型的分類,
5、以所得結(jié)論作為訓(xùn)練樣本,每個(gè)標(biāo)記為屬于兩類,對(duì)兩兩分類變量分別進(jìn)行支持向量機(jī)分析4,得出分類曲線,將數(shù)據(jù)區(qū)分開,觀察不同區(qū)域病人騙保情況,如果發(fā)現(xiàn)兩類病人較為明顯的區(qū)分在分類線兩側(cè),則認(rèn)為模型預(yù)測(cè)數(shù)據(jù)較為準(zhǔn)確。利用R軟件建立支持向量線性模擬檢測(cè)器,對(duì)分類結(jié)果進(jìn)行檢驗(yàn),繪制圖形如下。通過上述圖像定性分析,圈點(diǎn)和差點(diǎn)基本分布在分類線兩側(cè),檢測(cè)器找到一條支持向量檢測(cè)線很好地將兩類數(shù)據(jù)分開,區(qū)分情況與我們先前推測(cè)的結(jié)果基本符合,由此得出結(jié)論在一定誤差范圍內(nèi),一維支持向量機(jī)模型可以很好區(qū)分不同類別病人,該數(shù)學(xué)模型具有較高的準(zhǔn)確性與科學(xué)性。三、 結(jié)果分析運(yùn)用模糊層次分析法進(jìn)行分析,采用熵值法,根據(jù)各項(xiàng)指標(biāo)觀測(cè)值所提供的信息的大小確定出不同指標(biāo)的對(duì)應(yīng)權(quán)重,購藥總花費(fèi)系數(shù)<購藥頻數(shù)系數(shù)<開囑醫(yī)生數(shù)目系數(shù),開囑醫(yī)生數(shù)目所占權(quán)重最大,可以預(yù)測(cè)大多數(shù)詐騙人員都具有開囑醫(yī)生多的特點(diǎn),對(duì)于這一類病人應(yīng)進(jìn)行重點(diǎn)排查,防止詐騙行為的發(fā)生。最后得出疑似欺詐病例,其主要特點(diǎn)是購藥花費(fèi)大、買藥次數(shù)多、開囑醫(yī)生多,可見前期變量選擇準(zhǔn)確,可以很好反映欺詐病人特點(diǎn),醫(yī)院可以從這三方面入手加強(qiáng)監(jiān)管力度,發(fā)現(xiàn)潛在的醫(yī)保欺詐病人,一旦查出欺詐病人則吊銷其醫(yī)??ㄌ?hào),嚴(yán)厲打擊醫(yī)保騙保行為。本文在最后依據(jù)有監(jiān)督學(xué)習(xí)原理,引入支持向量機(jī)線性模擬器,判斷推
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 茯苓皮提取物在肝臟疾病早期診斷中的應(yīng)用前景-洞察及研究
- 農(nóng)村電商發(fā)展態(tài)勢(shì)-洞察及研究
- 氣候變化對(duì)洞穴石筍形態(tài)的重構(gòu)作用-洞察及研究
- 高效評(píng)估工具開發(fā)-洞察及研究
- 流處理系統(tǒng)自適應(yīng)優(yōu)化-洞察及研究
- 可降解塑料在化妝品包裝中的研究-洞察及研究
- 化療與放療聯(lián)合方案優(yōu)化研究-洞察及研究
- 面向5G的QoS標(biāo)準(zhǔn)化-洞察及研究
- 高速服務(wù)區(qū)安全生產(chǎn)管理制度
- 安全生產(chǎn)風(fēng)險(xiǎn)公告制度
- 湖北中煙2024年招聘考試真題(含答案解析)
- 2026年常州機(jī)電職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試題庫及答案1套
- 2026年稅務(wù)師執(zhí)業(yè)規(guī)范考試題目含答案
- 2026年江蘇農(nóng)林職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試模擬測(cè)試卷必考題
- 廣東省廣州市八區(qū)聯(lián)考2024-2025學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測(cè)數(shù)學(xué)試卷(含答案)
- 選舉法知識(shí)課件
- 蒸汽管道安裝現(xiàn)場(chǎng)施工方案
- 2024年中考英語真題分類匯編-記敘文閱讀理解(含答案)
- 2026年開封職業(yè)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫及完整答案詳解1套
- 雨課堂學(xué)堂在線學(xué)堂云《美國(guó)社會(huì)與文化(浙理)》單元測(cè)試考核答案
- 風(fēng)險(xiǎn)和機(jī)遇識(shí)別及應(yīng)對(duì)措施-氣侯變化
評(píng)論
0/150
提交評(píng)論