資源描述:
《銀行個人客戶信用評分模型研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、銀行個人客戶信用評分模型研究 數(shù)據(jù)挖掘;決策樹;信用評分 中圖分類號:F27 文獻(xiàn)標(biāo)識碼:A :16723198(2015)19006402 1個人信用評分 一般信用的考察對象有兩個:企業(yè)和個人。對于不同對象研究方式不同,但考察目的相同,即分析借款人的還款意愿和能力。本文研究的是個人信用,個人信用指的是基于信任、通過一定的協(xié)議或契約提供給自然人(及其家庭)的信用,使得接受信用的個人不用付現(xiàn)就可以獲得商品或服務(wù)。 個人信用評分,是指通過使用科學(xué)嚴(yán)謹(jǐn)?shù)姆治龇椒?,綜合考察影響個人及其家庭的內(nèi)在和外在的主客觀環(huán)境,
2、并對其履行各種經(jīng)濟(jì)承諾的能力進(jìn)行全面的判斷和評估。針對不同的應(yīng)用,個人信用評分分為風(fēng)險評分、收入評分、響應(yīng)度評分、客戶流失(忠誠度)評分、催收評分、信用卡發(fā)卡審核評分、房屋按揭貸款發(fā)放審核評分、信用額度核定評分等。個人信用評分是對個人信用的一種定量化描述,用客觀的方式來預(yù)測信用行為。它具有減少和控制風(fēng)險、輔助準(zhǔn)確決策等作用。 2數(shù)據(jù)采集 2.1指標(biāo)體系的選擇 在實際的環(huán)境中,并不是所有的數(shù)據(jù)項都可為研究所用,因而本文結(jié)合專家法和實際可獲取數(shù)據(jù),選取了衡量客戶的信用情況的四大主要因素,即:基本情況、職業(yè)情況、家庭情況
3、、與銀行的往來業(yè)務(wù)關(guān)系?! ?.2數(shù)據(jù)的采集 指標(biāo)體系確定后,我們確立了具體的考察指標(biāo),并擬出了一份銀行客戶信息的調(diào)查問卷,在銀行進(jìn)行發(fā)放,發(fā)放總數(shù)100分,回收86份,回收率86%。 3數(shù)據(jù)預(yù)處理 現(xiàn)實世界中經(jīng)過初步采集后的數(shù)據(jù)多半是有問題的,所以需要對數(shù)據(jù)源進(jìn)行清洗和轉(zhuǎn)換。數(shù)據(jù)預(yù)處理技術(shù)包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換與數(shù)據(jù)歸約。本文收集到的數(shù)據(jù)較少,內(nèi)容也較簡單,不需要進(jìn)行數(shù)據(jù)集成與數(shù)據(jù)歸約,所以本文的預(yù)處理過程只需進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換?! ?.1數(shù)據(jù)清理 初步采集的數(shù)據(jù)有很多是不完整的,本文對于這些空缺
4、值采取最大頻數(shù)填充法。下面以“學(xué)歷”為例,介紹最大頻數(shù)填充法(參照表1)。在教育程度中,存在6條空缺值,記錄顯示“大學(xué)本科”的頻率為27.90%,且這些記錄的“行業(yè)類別”信息都存在,其中5條都屬于“教育”類,再對“教育”行業(yè)所有記錄進(jìn)行分析,有56.30%的記錄學(xué)歷為“大學(xué)本科”,是該行業(yè)最高的學(xué)歷頻率,所以可以將5條“學(xué)歷”空缺值補(bǔ)為“大學(xué)本科”?! ≡诓杉降臄?shù)據(jù)中,有些數(shù)據(jù)存在明顯錯誤,這類數(shù)據(jù)稱為“偽樣本”。如在數(shù)據(jù)源中發(fā)現(xiàn)有數(shù)據(jù)顯示月均收入很低,沒有任何擔(dān)保卻得到了大額貸款等。這些“偽樣本”必須剔除?! ?.2
5、數(shù)據(jù)變換 本文需要把原始數(shù)據(jù)中字符型的數(shù)據(jù)轉(zhuǎn)化為數(shù)值型的數(shù)據(jù),以達(dá)到適用于分析軟件的目的。例如:“性別”、“健康狀況”、“家庭人均月收入”等字段,要把這些文本型變量轉(zhuǎn)化為數(shù)值型變量,以家庭人均月收入為例(如表2)?! 〗?jīng)過處理,得到了86條記錄,其中每個記錄含有14個屬性(1個決策屬性和13個條件屬性)。該數(shù)據(jù)集作為進(jìn)入數(shù)據(jù)挖掘軟件的測試數(shù)據(jù)集?! ?建立個人信用評分決策樹模型 4.1用spss軟件生成樹 在spss錄入數(shù)據(jù)并定義變量屬性,把“連續(xù)拖欠月數(shù)”作為本文的決策屬性(因變量),而其他的屬性都作為為條件屬性
6、(自變量),在CRT中選擇GINl分類樹,輸出結(jié)果,得到GINI分類的決策樹(如圖1)?! ?.2屬性賦權(quán) 給14個屬性進(jìn)行賦權(quán)量化(如圖4)?! ?.3個人信用評分模型結(jié)果 個人評分模型建立過程(如圖5)?! ≡趯?6個樣本進(jìn)行分析后,這三種級別的比例為(57.4%,31.08%,11.52%)。根據(jù)評估模型評分并結(jié)合得出的信用保險系數(shù)進(jìn)行分析,得出信用評分與信用級別對應(yīng)表(如表3)?! ?.4個人信用評分模型的調(diào)整 在銀行的實際操作中,常常無法對中、低信用用戶做出合理評價,對此,需要對其信息采取進(jìn)一步收集的方法
7、,以得出更完善的個人信用評分模型。具體的情況包含三個方面: ?。?)實力較強(qiáng)的銀行可以放低拒絕標(biāo)準(zhǔn); ?。?)在社會整體發(fā)展背景形勢好的情況下,對于信用卡用戶要求可以適當(dāng)放寬; ?。?)主客觀評價建模方法相結(jié)合,才能得出更可靠的信用評分模型,本文只是采用了客觀評價建模方法,還應(yīng)引入主觀建模方法(比如:AHP層次分析法、貝葉斯分析方法等)對本文信用評分模型進(jìn)行調(diào)整、完善。