資源描述:
《基于改進(jìn)隨機(jī)森林的軟件故障預(yù)測(cè)模型研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、代號(hào)10701學(xué)號(hào)1021121274分類(lèi)號(hào)TP311.5密級(jí)公開(kāi)題(中、英文)目基于改進(jìn)隨機(jī)森林的軟件故障預(yù)測(cè)模型研究ResearchontheSoftwareDefectPredictionTheDesign,ImplementationandApplicationofaWEBModelBasedontheImprovedRandomForest作者姓名嚴(yán)蕾指導(dǎo)教師姓名、職務(wù)段振華教授學(xué)科門(mén)類(lèi)工學(xué)學(xué)科專(zhuān)業(yè)計(jì)算機(jī)軟件與理論提交論文日期二○一三年三月西安電子科技大學(xué)學(xué)位論文獨(dú)創(chuàng)性(或創(chuàng)新性)聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)?/p>
2、學(xué)分和優(yōu)良的科學(xué)道德,本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說(shuō)明并表示了謝意。申請(qǐng)學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)一切的法律責(zé)任。本人簽名:日期:西安電子科技大學(xué)關(guān)于論文使用授權(quán)的說(shuō)明本人完全了解西安電子科技大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定
3、,即:研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬西安電子科技大學(xué)。學(xué)校有權(quán)保留送交論文的復(fù)印件,允許查閱和借閱論文;學(xué)校可以公布論文的全部或部分內(nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存論文。同時(shí)本人保證,畢業(yè)后結(jié)合學(xué)位論文研究課題再撰寫(xiě)的文章一律署名單位為西安電子科技大學(xué)。(保密的論文在解密后遵守此規(guī)定)本學(xué)位論文屬于保密,在年解密后適用本授權(quán)書(shū)。本人簽名:導(dǎo)師簽名:日期:日期:摘要摘要在軟件開(kāi)發(fā)過(guò)程中,準(zhǔn)確地預(yù)測(cè)有故障傾向的軟件模塊可以幫助測(cè)試人員以及開(kāi)發(fā)人員高效地發(fā)現(xiàn)軟件故障。對(duì)于大型系統(tǒng),軟件
4、故障預(yù)測(cè)就更加重要,因?yàn)樗軌驇椭_(kāi)發(fā)人員在開(kāi)發(fā)過(guò)程中將精力和資源集中使用在容易出現(xiàn)故障的模塊,從而更合理地分配資源。目前軟件故障預(yù)測(cè)模型主要是通過(guò)機(jī)器學(xué)習(xí)算法來(lái)構(gòu)建的,軟件故障預(yù)測(cè)主要是根據(jù)軟件質(zhì)量屬性以及軟件的歷史故障數(shù)據(jù)來(lái)對(duì)被測(cè)系統(tǒng)的軟件模塊進(jìn)行故障預(yù)測(cè)。本文首先對(duì)軟件質(zhì)量屬性進(jìn)行了研究,包括方法級(jí)屬性集合McCabe和Halstead,面向?qū)ο?OO)屬性集合。本文提出的軟件故障預(yù)測(cè)模型采用方法集屬性與面向?qū)ο髮傩韵嘟Y(jié)合的方法對(duì)軟件進(jìn)行度量。針對(duì)軟件故障數(shù)據(jù)的不平衡性問(wèn)題,本文提出了一種改進(jìn)的隨機(jī)森林
5、算法,在對(duì)模型進(jìn)行訓(xùn)練前首先對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行平衡化處理,以減少訓(xùn)練數(shù)據(jù)對(duì)模型準(zhǔn)確度的影響,模型生成后在保證預(yù)測(cè)準(zhǔn)確率較高的情況下精簡(jiǎn)模型,提高預(yù)測(cè)效率。應(yīng)用本文提出的算法對(duì)Eclipse中的數(shù)據(jù)進(jìn)行處理,實(shí)驗(yàn)表明本文提出的改進(jìn)算法性能高于其他現(xiàn)存的機(jī)器學(xué)習(xí)算法。關(guān)鍵詞:軟件質(zhì)量軟件故障預(yù)測(cè)模型隨機(jī)森林算法決策樹(shù)AbstractAbstractDuringthedevelopmentprocessofsoftware,accuratepredictionoffaultpronemodulesenablesthe
6、testersanddeveloperstoidentifythedefectsefficiently.Softwaredefectpredictionmodelsaremorevaluableforthelarge-scalesystem,wherethedevelopersneedtofocustheirattentionandresourcesonthefaultpronemodulesinthesystemunderdevelopment.Currently,manymachinelearningal
7、gorithmshavebeendevelopedandappliedforsoftwaredefectprediction.Softwarepredictionmodelsmainlyusesoftwarequalityattributesandthehistoricaldefectrecordstodiscoverthefaultpronemodelsinthesystemundertesting.Firstlyinthisthesis,softwarequalitymetrics,includingme
8、thodlevelmetricsets(McCabe,Halstead)andtheObject-Orientedmetricsetsarestudied.Thesoftwarepredictionmodelproposedinthisthesisusesthecombinationofmethodlevelmetricsetsandobject-orientmetricsetstomeasures