資源描述:
《基于決策樹算法的考試成績分析系統(tǒng)的研究與開發(fā)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、湖南大學(xué)碩士學(xué)位論文基于決策樹算法的考試成績分析系統(tǒng)的研究與開發(fā)姓名:黃愛輝申請學(xué)位級別:碩士專業(yè):計算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:陳湘濤20080616基于決策樹算法的考試成績分析系統(tǒng)的研究與開發(fā)摘要在高職院校的教學(xué)管理中,特別是學(xué)生成績管理工作中,每年產(chǎn)生大量的學(xué)生成績數(shù)據(jù),但對這些數(shù)據(jù)的處理還停留在簡單的數(shù)據(jù)備份、查詢及簡單統(tǒng)計階段,并沒有對這些成績數(shù)據(jù)進(jìn)行深入的分析,找到有利于教學(xué)管理的信息,這是對教學(xué)信息資源的浪費。數(shù)據(jù)挖掘技術(shù)正是解決這個問題的可行而有效的方法。數(shù)據(jù)挖掘是一個新興的邊緣學(xué)科,經(jīng)過十幾年的努力,數(shù)據(jù)挖掘
2、在許多領(lǐng)域都取得了廣泛的應(yīng)用。本文著重研究了數(shù)據(jù)挖掘分類算法,對決策樹ID3算法、C4.5算法的理論進(jìn)行了詳細(xì)的介紹和分析,通過對各種常用分類算法的比較研究,總結(jié)了各種分類算法的優(yōu)點和缺點,為選擇使用C4.5決策樹算法提供了依據(jù)。針對C4.5算法計算量大的缺點,利用高等數(shù)學(xué)中的等價無窮小原理提出了改進(jìn)的C4.5算法,減少了計算量,提高了構(gòu)造決策樹的效率,并用UCI中的數(shù)據(jù)集對C4.5算法和改進(jìn)后的C4.5算法進(jìn)行了對比試驗。為了使數(shù)據(jù)挖掘中的決策樹算法應(yīng)用在高職學(xué)生的成績分析中,提出了決策樹算法在高職院校學(xué)生成績分析中的
3、應(yīng)用方案,構(gòu)建了成績分析模型;并對學(xué)生成績數(shù)據(jù)庫中的成績進(jìn)行了數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)削減等數(shù)據(jù)預(yù)處理,處理了空缺數(shù)據(jù)、將連續(xù)值屬性離散化,建立了數(shù)據(jù)挖掘數(shù)據(jù)庫。使用改進(jìn)后的C4.5決策樹算法生成決策樹,由決策樹產(chǎn)生分類規(guī)則,從分類規(guī)則中找出影響高職學(xué)生學(xué)習(xí)成績的主要因素,為學(xué)院教學(xué)管理部門和教師有針對性的提高教學(xué)質(zhì)量提供有力的數(shù)據(jù)支持;對高職院校計算機(jī)應(yīng)用技術(shù)專業(yè)的課程設(shè)置體系進(jìn)行了簡單的探討。關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹;e4.5算法;成績分析IIAbstractInthemanagementofhighervocati
4、onalinstitutions,especiallYinthemanagementofstudentachievementineachofalargenumberofstudentachievementdata,buttheprocessingofsuchdatastillremaininasimpledatabackuP.enquiriesandsimplestatisticalstage,andnotontheseresultsAn1ndePthanalysisofthedata,findtheteachingis
5、conducivetotheworkoftheinformatlon,thisistheteachingofinformationawasteofresources.Dataminingtechnologytosolvethisproblemisaviableandeffectivemethod.DataMiningisanemerglngdisciplineonthebrink,aftermorethan10yearsofefforts,datamininglnmanyareasonawiderangeofapplic
6、ations.Thisarticlefocusesontheclassificationofdataminingalgorithms,thedecisionmakingID3algorithm,C4.5algorithmtheorycarriedoutadetaileddescriptionandanalysis.commonlyusedbythevariousclassificationalgorithmthecomparatlVestudV,summarizedthevariousclassificationalgo
7、rithmthestrengthsandweaknesSes,TheoptionofusingC4.5decisiontreealgorithmprovidesabasis·C4·5algorithmforcalculatingthevolumeoftheshortcomingsoftheuseofmathematicalprinciPleofeauivalenceinfinitesimalmadetoimprovetheC4.5algorithm,toreducetheamountofcomputationandimp
8、rovetheefficiencyofthedecisiontreestructure,andusethedatasetsintheUCIonC4.5algorithmandimprovingthealgorithmswerecomparedC4.5test.Inthispaper,datamininginthede