資源描述:
《基于決策樹的高校學(xué)生成績分析和研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、學(xué)校代號(hào):10532學(xué)號(hào):G11245011密級(jí):普通湖南大學(xué)工程碩士學(xué)位論文基于決策樹的高校學(xué)生成績分析和研究詮塞筌避目塑!至Q!壘生§旦2壘旦AnalysisandResearchofCollegeStudents’recordsBasedonDecisionTr.eeB.A.(GuangdongPolytechnicNormalUniversity)2003AthesissubmittedinparaaJsatisfactionoftheintheGraduateSchoolofHunanUniversitySupervisorApril,2014湖南大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭
2、重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名:夏嘲乞J\日期:沙晰6月r日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)湖南大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。
3、本學(xué)位論文屬于1、保密口,在年解密后適用本授權(quán)書。2、不保密口。(請(qǐng)?jiān)谝陨舷鄳?yīng)方框內(nèi)打“√”)作者簽輒,了嘲乞日期.沙艫年占月r日導(dǎo)師簽名:藏。\。冽.日期:o一怠f中年厶月r日珥嘲高校學(xué)生檔案分析與信息挖掘研究摘要數(shù)據(jù)挖掘技術(shù)是信息技術(shù)發(fā)展到一定階段的產(chǎn)物,目前它已成為計(jì)算機(jī)科學(xué)與工程研究領(lǐng)域方面研究和應(yīng)用的熱點(diǎn)。數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中抽取隱含在其中、事先不知但又有潛在信息和知識(shí)的過程。數(shù)據(jù)挖掘在國內(nèi)外已經(jīng)取得了許多令人矚目的成就,同時(shí)在很多領(lǐng)域得以成功應(yīng)用。目前,數(shù)據(jù)挖掘技術(shù)已在我國推廣,但在教學(xué)方面的應(yīng)用比較少。在過去的數(shù)十年里,由于高等院校的不斷擴(kuò)招,學(xué)生人數(shù)上漲,加大了學(xué)
4、生信息管理方面的工作難度。很多高校都在教學(xué)管理方面積累了大量數(shù)據(jù),這些信息不能發(fā)揮其應(yīng)有的作用和功能,原因在于數(shù)據(jù)基本還停留在簡單的統(tǒng)計(jì)、備份和查詢的階段,對(duì)于一些不易察覺的信息沒有深入的分析。由此可見,傳統(tǒng)的數(shù)據(jù)管理方法已經(jīng)不適應(yīng)現(xiàn)代教育的發(fā)展要求,怎樣高效地管理好學(xué)生的各種信息成為~個(gè)日益突出的問題,而數(shù)據(jù)挖掘是解決這個(gè)問題的可行而有效的方法。決策樹技術(shù)是數(shù)據(jù)挖掘分類和預(yù)測(cè)的主要技術(shù),它是通過一組無次序、無規(guī)則的實(shí)例中推理出決策樹表現(xiàn)形式的分類規(guī)則。本文在深入研究數(shù)據(jù)挖掘的基本理論和相關(guān)算法的基礎(chǔ)上,將決策樹技術(shù)應(yīng)用到高校學(xué)生信息檔案管理中的學(xué)生成績分析研究中,設(shè)計(jì)與實(shí)現(xiàn)了基于決策
5、樹的高校學(xué)生成績分析處理系統(tǒng)。首先,以高校學(xué)生信息檔案中的學(xué)生成績數(shù)據(jù)作為原始數(shù)據(jù),并通過數(shù)據(jù)采集、調(diào)查表等方式補(bǔ)充收集數(shù)據(jù),運(yùn)用預(yù)處理技術(shù)生成數(shù)據(jù)集;然后,利用C4.5算法生成學(xué)生成績分析決策樹模型,并結(jié)合學(xué)生檔案數(shù)據(jù)進(jìn)行處理;最后,使用EnterpriseMiner實(shí)驗(yàn)平臺(tái)對(duì)學(xué)生數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證和結(jié)果分析,研究學(xué)生興趣愛好、主動(dòng)學(xué)習(xí)習(xí)慣、課程實(shí)驗(yàn)等因素對(duì)學(xué)生成績的影響,從而準(zhǔn)確掌握學(xué)生的學(xué)習(xí)動(dòng)態(tài),為實(shí)際教學(xué)工作提供更多有價(jià)值的信息。關(guān)鍵詞:數(shù)據(jù)挖掘;學(xué)生信息;決策樹;C4.5算法Ⅱ工程碩士學(xué)位論文AbstractDataminingtechnologyistheproductofa
6、certainstageofdevelopmentoftheinformationtechnology.Ithasrecentlybecomethehottopicinthefieldsofcomputerscienceandengineeringresearch.Dataminingreferstotheprocessofexcavatingthosepotentialyetunknowninformationandknowledgehiddeninhugedatabase.Dataminingtechnologyhasbeenobtainingremarkableachieveme
7、ntsandsuccessfullyappliedinmanyfieldsabroadwhilebecomingmoreandmorepopularinourcountrythoughitisstillnotwidelyusedinteaching.Thetechnologycanbeusedtostrategicallyanalyzehugeamountofinformation,forecastfuturetrendsandhencemak