資源描述:
《一種基于boosting算法的新模型在銀行信用評級中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、:公開學(xué)巧代巧:10004密級如#、交迷乂肇BEIJINGJ1AOTONGUNIVERSITY碩±學(xué)位論文一oo種基于Bsting算法的新模型在銀行信用評級中的應(yīng)用作者姓名奮瓣學(xué)科專業(yè)計(jì)算數(shù)學(xué)指導(dǎo)教師張作泉教授培養(yǎng)院系理學(xué)院論 ̄月,里f灰細(xì)如#、交瓜鋒碩±學(xué)位論文一oo種基于目sting算法的新模型在銀行信用評級中的應(yīng)用ApplicationofANewModelBasedonBoostingAlgori化minBankCreditScoring作者:崔瑞
2、導(dǎo)師:張作泉教授北巧交通大學(xué)2016年6巧學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解北京交通大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定。特授權(quán)北京交通火學(xué)可W將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,提供閱覽服務(wù),并采用影印、縮印或掃描等復(fù)制手段保存、匯編w供查閱和借閱。同意學(xué)校向國家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和磁盤。學(xué)??桑诪榇嬖陴^際合作關(guān)系的兄弟高校用戶提供文獻(xiàn)傳遞服務(wù)和交換服務(wù)。(保密的學(xué)位論文在解密后適用本授權(quán)說明)^P學(xué)位論文作者簽名:導(dǎo));見雜!幣簽名簽字日期:W乂年(月3日簽字日期:心(年
3、^月日^:10004巧校代碼密級:公開化京交通大學(xué)碩±學(xué)位論文一種基于Boosting算法的新模型在銀行信用評級中的應(yīng)用ApplicationofaNewModelBa化donBoostinAlorithminBankggCreditScoring作者姓名:崔滯學(xué)號:1312巧巧導(dǎo)師姓名:張作泉職稱:教授學(xué)位類別:理學(xué)學(xué)位級別:碩i學(xué)科專業(yè):計(jì)算數(shù)學(xué)研究方向:金融工程北京交通大學(xué)2016年6月致謝、研究生s年學(xué)習(xí)生涯即將圓滿結(jié)束,,衷屯地感謝我敬愛的導(dǎo)師張作泉教授無
4、論是在學(xué)習(xí)上還是在生活工作中他都給予了我很大的幫助和支持。是他帶我叩響數(shù)據(jù)挖掘的大口,教會(huì)了我專業(yè)的知識,沒有他,我無法完成這篇文章,啟蒙之情銘記在也永生難忘。感謝王立春、江中豪、汪成詠、趙平福、商朋見、張尚立老師授予了我研巧生階段課程,他們細(xì)致耐也地授課為我打下了堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),培養(yǎng)了我嚴(yán)謹(jǐn)?shù)模崳姅?shù)學(xué)思維,謝謝你們。感謝我的師兄白榮全一、師姐張昕蕾、趙躍波和師妹毛亞楠。和他們起參與討論班探討問題的過程加深了我對各種統(tǒng)計(jì)模型的理解,,特別是我的師兄白榮全他耐也細(xì)致地幫助我們解決疑難困惑。,這篇論文他更提出了許多寶貴意見感謝我的
5、朋友李月娥、李惹和我的室友劉杰、張亞琴,她們的出現(xiàn)極大地豐富了我的研究生生活。感謝我的研巧生同學(xué),感謝充滿愛的數(shù)研口02班,讓我有了回家的感覺,希望大家前程似錦。感謝我的父母,你們是,為我提供了良好的教育環(huán)境和無微不至的照顧我前進(jìn)的動(dòng)力。II北京交通大學(xué)碩丄學(xué)位論義巧要摘要銀行擁有大量的信用貸款數(shù)據(jù),大數(shù)據(jù)時(shí)代運(yùn)用信用評分模型去準(zhǔn)確地判斷申請人的信用風(fēng)險(xiǎn)是未來發(fā)展的趨勢。在實(shí)際的信用評分?jǐn)?shù)據(jù)庫中,信用好的申請者通常都比信用不好的申請者多很多,從而導(dǎo)致了數(shù)據(jù)集的不平衡,而機(jī)器學(xué)習(xí)在不平衡數(shù)據(jù)集上的訓(xùn)練往往對小類
6、的識別率比較低,錯(cuò)誤地給予信用不好的申請者貸款會(huì)給銀行帶來巨大的商業(yè)危害,因此提離分類器對小類的識別至關(guān)重要。一法的新模型H一本文提出了種基于混合重抽樣和Boosting算SBoost。第階段,對不平衡數(shù)據(jù)集進(jìn)行混合重抽樣處理,從而獲得平衡的樣本訓(xùn)練集;第二階段,利用Boosting算法更改容易被錯(cuò)誤分類的小類樣本的權(quán)值,從而來提髙分類器對小類樣本的識別能力。本文利用UCI數(shù)據(jù)庫的信用評分?jǐn)?shù)據(jù)集,運(yùn)用HSBoost算法做實(shí)證分析,用SVM、BP神經(jīng)網(wǎng)絡(luò)、DT作為基本分類器,對比己有的RUSBoost算法、SMOTEBoos
7、t算法、混合重抽樣技術(shù)和兩種基本重抽樣技術(shù),驗(yàn)證了HSBoost算法的有效性和可行性,提高了分類器對小類的識別率。同時(shí)利用非參數(shù)Wilcoxon配對符號秩檢驗(yàn),證明了HSBoost算法顯著優(yōu)于SMOTEBoost算法。關(guān)鍵詞:信用評級;不平衡數(shù)據(jù);HSBoost算法III化南交通乂學(xué)碩丄-學(xué)位論父ABSTRACTABSTRACTIntheeraof目igData,usi打gcreditscoringmodeltoaccuratelyjudgethe'alcantscreditrisksetar
8、ovtrenteppibadonbigda