資源描述:
《基于貝葉斯的防病患欺詐模型研究-論文.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、現(xiàn)代商貿(mào)工業(yè)NO.1O,2O14ModernBusinessTradeIndustry2014年第1O期基于貝葉斯的防病患欺詐模型研究潘芳(1.南京中醫(yī)藥大學(xué),江蘇南京210023;2.東南大學(xué)經(jīng)濟(jì)管理學(xué)院,江蘇南京210096)摘要:為避免病患欺詐給我國相關(guān)部門帶來的極大經(jīng)濟(jì)損失,甚至?xí):Φ轿覈t(yī)療的進(jìn)一步發(fā)展,采用貝葉斯分類對防病惠欺詐模型進(jìn)行了研究,并對其性能進(jìn)行測試。測試結(jié)果表明所建模型性能良好。研究成果可為相關(guān)部門防范病患欺詐提供理論支持。關(guān)鍵詞:貝葉斯;病患;欺詐;異常檢測;社會穩(wěn)定中圖分類號:F27文獻(xiàn)標(biāo)識碼:A文章編號:1672-3
2、198(2014)10-0080-030引言.者的手續(xù)已趨于簡單化,一般只需提供證件號碼和地址即目前社會上存在著一些不法分子在履行參保繳費(fèi)義務(wù)可辦理,所以現(xiàn)在相關(guān)部門所擁有的客戶基本信息已經(jīng)很上虛構(gòu)事實(shí),隱瞞真相,以騙取醫(yī)保權(quán)益,或在醫(yī)療行為上簡單,很難從中發(fā)現(xiàn)對欺詐分析有價(jià)值的信息。而動態(tài)數(shù)虛構(gòu)事實(shí),隱瞞真相,以騙取醫(yī)保基金或醫(yī)保待遇。這類欺據(jù)反映的是具體行為,往往可能隱藏一些行為特征,所以應(yīng)詐行為在各個(gè)國家普遍存在。美國聯(lián)邦政府多次表示,打從動態(tài)數(shù)據(jù)中進(jìn)行挖掘,嘗試從中發(fā)現(xiàn)欺詐行為的一些規(guī)擊醫(yī)療保險(xiǎn)詐騙案,是醫(yī)療保險(xiǎn)改革議程的重要組成部分。律和特
3、征。通過對欺詐行為的具體分析,本文得出貝葉斯分類模型所需要的訓(xùn)練樣本集的各屬性(如表1)。這些違法行為已經(jīng)給我們國家?guī)砹藰O大的經(jīng)濟(jì)損失,嚴(yán)表1illI練樣本集屬性重影響我國醫(yī)療行業(yè)的進(jìn)一步發(fā)展。我國雖還沒有完整的社會醫(yī)療保險(xiǎn)欺詐統(tǒng)計(jì)數(shù)據(jù),但防病患欺詐已經(jīng)成為引起學(xué)者重視的社會問題。就目前業(yè)界人士認(rèn)為,防范欺詐的手段有兩個(gè),一是政策調(diào)控.采用行政手段,依靠法律和行業(yè)互助來限制這種不良行為;二是利用技術(shù)手段,防范于未然。兩者相比,利用技術(shù)手段是目前最佳的防范欺詐手段。實(shí)踐證明較為有效模型建立如下:的有NCR公司開發(fā)的Teradata數(shù)據(jù)倉庫。Tanig
4、uchi等學(xué)(1)每個(gè)數(shù)據(jù)樣本用一個(gè)n維特征向量X一者也提出了三種欺詐偵測方法。國內(nèi)對這種防病患欺詐主{x1,X2,?x)表示,分別描述對n個(gè)屬性AI,A2,?,A要采用的還是行政手段。夏宏等認(rèn)為要加強(qiáng)法律法規(guī)建樣本的n個(gè)度量,即為病患設(shè)定的基本屬性例如年齡、出生,消費(fèi)金額等。設(shè).完善醫(yī)療保險(xiǎn)制度等措施。李連友等梳理了相關(guān)制度,(2)假定有1T1個(gè)類C1,Ce,?C。給定一個(gè)未知的數(shù)據(jù)指出應(yīng)該做一些實(shí)證研究。楊鶴標(biāo)等提出了基于概率分布樣本X(即沒有類標(biāo)號),分類法將預(yù)測X屬于具有最高后的異常檢測模型,但該模型只能應(yīng)用于已結(jié)束治療且有醫(yī)驗(yàn)概率(條件X下
5、)的類。即貝葉斯分類將未知的樣本分配療欺詐嫌疑的情況。給類Ci當(dāng)且僅當(dāng)P()>P(),1≤j≤m,j≠i。綜上可知,國內(nèi)對防病患欺詐問題的研究處于起步階段.需要一種技術(shù)為作為重要手段來解決目前存在的病患則,最大化e(Ci一)。其P(簧)最大的類ci稱為最大欺詐問題。與此同時(shí),貝U-斯分類以其簡單,高效與準(zhǔn)確等后驗(yàn)假定。可得:特點(diǎn)。在一些實(shí)際的事例里得到了廣泛的研究與應(yīng)用。本文嘗試運(yùn)用貝葉斯的相關(guān)理論與方法建立防病患欺詐模P(簧)一㈩型,對未知類別屬性的患者進(jìn)行預(yù)測,識別有欺詐趨向的病(3)由于P(X)對于所有類為常數(shù),只需要P(XJCi)P(Ci)最
6、大即可。如果類的先驗(yàn)概率未知,則通常假定這些類患。為相關(guān)醫(yī)療部門有針對性地采取處理措施,防范病患是等概率的,即P(c1)一P(Ce)~·一P(CⅡ.)。并據(jù)此只對欺詐行為的發(fā)生,減少欺詐行為帶來的經(jīng)濟(jì)損失提供理淪Pf會1最大化。否則,最大化P(xlC。)P(C.)。類的先驗(yàn)概支持。l模型構(gòu)建率可以用P(Ci)一計(jì)算,其中s是類Ci中的訓(xùn)練樣本客戶的數(shù)據(jù)主要包括兩種:靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜數(shù),而s是iJil練樣本總數(shù)。態(tài)數(shù)據(jù)指的足通常不會改變的數(shù)據(jù).如客戶的基本信息等。(4)給定具有許多屬性的數(shù)據(jù)集·計(jì)算I(舍)的開銷可動態(tài)數(shù)據(jù)指的是經(jīng)常或定期改變的數(shù)
7、據(jù)信息,如每月消費(fèi)金額.交費(fèi)記錄等。由于社會對人的隱私權(quán)的尊重,現(xiàn)在患能非常大。為降低計(jì)算P()的1:銷,在下面的模型中我一一Rf)——現(xiàn)代商貿(mào)工業(yè)No.10,2O14ModernBusinessTradeIndustry2O14年第lO期們做了類條件獨(dú)立的假定。給定樣本的類標(biāo)號,假定屬性首先計(jì)算先驗(yàn)概率P(Ci),i=l,2。值相互條件獨(dú)立,即在屬性問,不存在依賴關(guān)系。這樣,P(C1)一P(IsFraud=”yes”)一7/15—0.47—P(C2)=P(IsFraud一”no”)8/15—0.54(薈)一"rIXk)然后計(jì)算P(XlCi),i一1
8、,2。為了計(jì)’算它,需要計(jì)算以概率P(),p(X2一),?P()可以由訓(xùn)練樣本估值,下條件概率:P(X1lC