資源描述:
《決策樹技術(shù)在高校學(xué)生成績分析中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、代號10701學(xué)號0822980057分類號TP312密級公開題(中、英文)目決策樹技術(shù)在高校學(xué)生成績分析中的應(yīng)用研究ApplicationofDecisionTreeintheUniversityachievementAnalysis作者姓名董歡指導(dǎo)教師姓名、職務(wù)王凱東副教授學(xué)科門類工科學(xué)科、專業(yè)計算機應(yīng)用技術(shù)提交論文日期二○一二年四月二十日西安電子科技大學(xué)學(xué)位論文創(chuàng)新性聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)膶W(xué)分和優(yōu)良的科學(xué)道德,本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容
2、以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說明并表示了謝意。申請學(xué)位論文與資料若有不實之處,本人承擔(dān)一切的法律責(zé)任。本人簽名:日期西安電子科技大學(xué)關(guān)于論文使用授權(quán)的說明本人完全了解西安電子科技大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬西安電子科技大學(xué)。學(xué)校有權(quán)保留送交論文的復(fù)印件,允許查閱和借閱論文;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以允許采用影印
3、、縮印或其它復(fù)制手段保存論文。同時本人保證,畢業(yè)后結(jié)合學(xué)位論文研究課題再撰寫的文章一律署名單位為西安電子科技大學(xué)。(保密的論文在解密后遵守此規(guī)定)本學(xué)位論文屬于保密,在年解密后適用本授權(quán)書。本人簽名:日期導(dǎo)師簽名:日期摘要由于高校的連年擴招,各個學(xué)校都積累了大量的學(xué)生基本數(shù)據(jù)信息和學(xué)習(xí)成績數(shù)據(jù)信息,但是這些數(shù)據(jù)都還停留在備份、查詢、簡單的統(tǒng)計的階段,不能發(fā)揮其應(yīng)有的作用。這樣就導(dǎo)致大量的成績數(shù)據(jù)只是以各不相同的表格形式存儲于不同的計算機上,不利于對這些數(shù)據(jù)所隱含的信息進(jìn)行充分的挖掘分析,不便于教學(xué)管理部門進(jìn)行有效的教學(xué)評價,也不利于
4、教師對其所帶學(xué)生的學(xué)習(xí)情況進(jìn)行全面的指導(dǎo)。本文主要應(yīng)用數(shù)據(jù)挖掘技術(shù)中的決策樹技術(shù)對高校學(xué)生的成績進(jìn)行分析,找出影響學(xué)生成績?nèi)〉谩皟?yōu)秀”和“差”的因素。在建立分類模型時,以信息增益率作為屬性選擇的度量標(biāo)準(zhǔn),對學(xué)生成績是否為“優(yōu)”的數(shù)據(jù)訓(xùn)練集應(yīng)用決策樹技術(shù)中的C4.5算法來進(jìn)行模型的建立,從而生成分類規(guī)則,得出影響學(xué)生成績?yōu)椤皟?yōu)”的因素。C4.5算法中以信息增益率作為屬性選擇的度量標(biāo)準(zhǔn)時,在計算屬性的信息量時涉及到了對數(shù)運算,計算時間效率低下。對計算屬性的信息量公式進(jìn)行改進(jìn),形成新的信息量計算方法。應(yīng)用改進(jìn)后的C4.5算法對屬性進(jìn)行信息
5、增益率的計算,并且對學(xué)生成績是否為“差”的數(shù)據(jù)訓(xùn)練集進(jìn)行模型的建立,生成分類規(guī)則,得出影響學(xué)生成績?yōu)椤安睢钡囊蛩?,為教師有針對性的提高教學(xué)質(zhì)量提供了有力的數(shù)據(jù)支持。關(guān)鍵字:數(shù)據(jù)挖掘決策樹技術(shù)C4.5成績分析AbstractDuetosuccessiveyearsofenrollmentoftheuniversity,everyschoolhasaccumulatedalargenumberofstudents’basicdataandachievementdata,butthesedataarestillstuckintheback
6、up,thequery,thestageofsimplestatistics,andcannotplayitsduerole.Thisledtoalotofperformancedataisonlystoredondifferentcomputersvaryintabularform,andthosedatacannotconducivetotheinformationimpliedbythesedatamininganalysis,cannottofacilitatetheteachingdepartmentsforeffecti
7、veteachingevaluation,andcannotconducivetocomprehensiveguidanceteachersbroughtstudentlearning.Inthisthesis,throughtheanalyzeofthecollegestudents’achievementsbasedondecisiontreetechnique,wegetthefactorsofidentifytheachievementsofcollegestudentsaffect"excellent"and"bad".i
8、ncreatingaclassificationmodel,wechoosethetherateofinformationgainasattributeselectionmetrics.weuseC4.5algorithmtosett