資源描述:
《基于數(shù)據(jù)挖掘的金融數(shù)據(jù)分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于數(shù)據(jù)挖掘的金融數(shù)據(jù)分析BasedonDataMininginFinancialDataAnalysis朱晶zhujing武漢大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)應(yīng)用專業(yè)研究生李石君Lishijun武漢大學(xué)計(jì)算機(jī)學(xué)院教授ComputerApplicationacademyofComputerScience,WuhanUniversity,Graduate,wuhan,430072,china[摘要]當(dāng)今,已是企業(yè)戰(zhàn)略及其市場地位與信息技術(shù)息息相關(guān)的時(shí)代,很難想象一個(gè)現(xiàn)代企業(yè)沒有完善的信息技術(shù)系統(tǒng)的支持,將會(huì)如何運(yùn)轉(zhuǎn)。但是,隨著信
2、息技術(shù)的發(fā)展,企業(yè)產(chǎn)生的數(shù)據(jù)大量地堆積和膨脹,其中很多十分有價(jià)值的信息隱藏在其中卻不被人們所發(fā)現(xiàn)。如何對這些海量的數(shù)據(jù)進(jìn)行管理,并從中提取潛在的有價(jià)值的信息,成為企業(yè)在激烈的市場中占據(jù)優(yōu)勢地位的關(guān)鍵點(diǎn)。因此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并且在各個(gè)行業(yè)領(lǐng)域中應(yīng)用,取得了廣泛和重大的進(jìn)展。本文即對數(shù)據(jù)挖掘在金融業(yè)的應(yīng)用情況進(jìn)行了探討。[summary]Todayisthecorporatestrategyanditsmarketpositionandiscloselyrelatedtotheeraofinformationte
3、chnology,itisdifficulttoimagineamodernenterprisewithnopropersupportforinformationtechnologysystemswillbehowitworks.However,withthedevelopmentofinformationtechnology,enterprisedatageneratedbylargenumbersofaccumulationandexpansion,manyofwhichareveryvaluableinfor
4、mationhiddeninthemnotbeingfoundbypeople.Howthesemassivedatamanagementandextractpotentiallyvaluableinformation,asenterprisesinthefiercemarketoccupythedominantpositionofthekeypoints.Therefore,dataminingtechniqueshaveemerged,andappliedinvariousindustries,hasmadee
5、xtensiveandsignificantprogress.Thispaperisondataminingapplicationsinthefinancialsectorwerediscussed。[關(guān)鍵詞]信息技術(shù)、數(shù)據(jù)管理、數(shù)據(jù)挖掘、金融業(yè)[keyword]Informationtechnology、Datamanagement、DataMining、Finance[中圖法分類號]Z42引言作為一個(gè)新興的研究領(lǐng)域,數(shù)據(jù)挖掘已經(jīng)廣泛的應(yīng)用到了眾多的領(lǐng)域,出現(xiàn)了大量大的商品化的數(shù)據(jù)挖掘系統(tǒng),金融數(shù)據(jù)挖掘是信息社會(huì)
6、中的一個(gè)極具挑戰(zhàn)性的研究方向,金融數(shù)據(jù)的隨機(jī)特性使得隱藏在數(shù)據(jù)中的內(nèi)在規(guī)則難以被發(fā)現(xiàn)。如何對這些隱藏的數(shù)據(jù)進(jìn)行管理,并從中提取潛在的有價(jià)值的信息,成為金融業(yè)在市場中占據(jù)優(yōu)勢地位的關(guān)鍵。1、數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘DM(DataMining)是對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行一定的處理,從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含的、事先未知的、但又是潛在有用的信息和知識的過程[1]。確切地講,DM是KDD過程中的一個(gè)步驟,其處理對象是大量的日常業(yè)務(wù)數(shù)據(jù),它主要基于人工只能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析原有
7、的海量數(shù)據(jù),做出歸納的推理,從中采掘出潛在的模式,預(yù)測未知的行為,提高信息的利用,改變“人們被數(shù)據(jù)淹沒,同時(shí)卻仍感到知識饑渴”的資源浪費(fèi)的局面。KDD是數(shù)據(jù)庫技術(shù)和機(jī)器學(xué)習(xí)兩個(gè)學(xué)科的交叉學(xué)科,由于KDD使用的數(shù)據(jù)來自于實(shí)際的數(shù)據(jù)庫,所要處理的數(shù)據(jù)量可能很大,因此DM中的學(xué)習(xí)算法的效率和可擴(kuò)充性就尤為重要;此外,KDD所處理的數(shù)據(jù)由于來自于現(xiàn)實(shí)世界,數(shù)據(jù)的完整性、一致性和正確性都很難保證,因此數(shù)據(jù)預(yù)處理也是很有必要的。2、數(shù)據(jù)挖掘在金融業(yè)的應(yīng)用金融事務(wù)需要搜集和處理大量紛繁復(fù)雜的數(shù)據(jù),大部分銀行和金融機(jī)構(gòu)提供豐富多樣
8、的銀行服務(wù)(如個(gè)人存款)、信用服務(wù)(如貸款、個(gè)人信用卡)和投資服務(wù)(如共同基金)。由于交易的頻繁性、信息的不對稱性加上從海量數(shù)據(jù)中挖掘信息,金融數(shù)據(jù)挖掘技術(shù)可以從這些信息中查找到有效的信息用來幫助監(jiān)管部門及投資部門進(jìn)行有效監(jiān)督和投資管理,可以幫助銀行部門描述客戶以往的需求趨勢并預(yù)測未來;可以分析潛在的信譽(yù)較差的客戶,及時(shí)采取措施減少資產(chǎn)損失等。金融機(jī)構(gòu)收集到