資源描述:
《基于數(shù)據(jù)挖掘的課程成績關(guān)聯(lián)性研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、隸。軔女·嚶碩士學位論文萬方數(shù)據(jù)基于數(shù)據(jù)挖掘的課程成績關(guān)聯(lián)性研究萬方數(shù)據(jù)THEI迮SEARCHOFCOURSESCOREASSOCIATIONBASEDONDATAMININGAThesisSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYYanYueSupervisedbyVice.ProfessorJiangChang-iin一一一SchoolofAutomationSoutheastUniversityMarch2014繆萬方數(shù)據(jù)東南大學學
2、位論文獨創(chuàng)性聲明本人聲明所呈交的學位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,除了文中特另tlDH以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得東南大學或其它教育機構(gòu)的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。研究生簽名:東南大學學位論文使用授權(quán)聲明東南大學、中國科學技術(shù)信息研究所、國家圖書館有權(quán)保留本人所送交學位論文的復(fù)印件和電子文檔,可以采用影印、縮印或其他復(fù)制手段保存論文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致
3、。除在保密期內(nèi)的保密論文外,允許論文被查閱和借閱,可以公布(包括刊登)論文的全部或部分內(nèi)容。論文的公布(包括刊登)授權(quán)東南大學研究生院辦理。研究生簽名:i虱蒸導(dǎo)師簽名萬方數(shù)據(jù)摘要摘要學生的課程成績不僅是學生對課程學習質(zhì)量的直觀反映,也是衡量教學質(zhì)量的重要依據(jù)。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又潛在有用的信息和知識的過程。對學生成績及相關(guān)數(shù)據(jù)進行數(shù)據(jù)挖掘,發(fā)現(xiàn)學生各課程學習效果之間的關(guān)聯(lián)關(guān)系并用于教學工作的指導(dǎo)有著重要的意義。本文在深入研究數(shù)據(jù)挖掘知識的基礎(chǔ)上完成了對本校應(yīng)用數(shù)學專業(yè)的學生課程
4、成績關(guān)聯(lián)關(guān)系的研究。論文詳細闡述了關(guān)聯(lián)規(guī)則分析模型和聚類分析模型的設(shè)計與實現(xiàn)及其在課程成績關(guān)聯(lián)性研究中的應(yīng)用,主要內(nèi)容包括:遵循數(shù)據(jù)倉庫設(shè)計的原則,在SQLServer2005中建立和課題需求的星型數(shù)據(jù)倉庫student—scoreDW。使用結(jié)構(gòu)化查詢語言T-SQL進行數(shù)據(jù)預(yù)處理,使其轉(zhuǎn)換為數(shù)據(jù)挖掘算法所需要的格式。實現(xiàn)聚類分析技術(shù)中的k.means算法在數(shù)據(jù)泛化預(yù)處理中的應(yīng)用。針對fp—growth算法的不足提出了其改進算法:基于共后綴項間頻繁閉項集的改進算法Cfp.growth算法使得生成關(guān)聯(lián)規(guī)則的冗余量降低,基于散列技術(shù)的改進算法HC
5、fp.growth算法使得算法的時間效率大大提高,基于事務(wù)矩陣的改進算法MCfp.growth算法使得時間效率提高的同時避免了大量的指針操作,同時避免了內(nèi)存泄露。對每一個改進算法的工作原理和過程均結(jié)合實例進行了詳細說明。并基于AdventureWorks數(shù)據(jù)庫對其進行了算法效率的測試,且對測試結(jié)果進行了理論分析。將改進后的算法應(yīng)用到學生課程成績關(guān)聯(lián)性的研究中,對學生成績這一關(guān)鍵性能指標進行數(shù)據(jù)挖掘,得出了同時滿足最小支持度閥值rainsup和最小置信度閥值minconf的學生成績關(guān)聯(lián)模式,挖掘出了學生課程成績之間的關(guān)聯(lián)性和關(guān)聯(lián)程度,分析了結(jié)
6、果的指導(dǎo)意義:注重課程之間的有機聯(lián)系、建立成績預(yù)警機制、提供就業(yè)參考和專業(yè)內(nèi)方向選擇的依據(jù)。論文還對目前數(shù)據(jù)挖掘技術(shù)研究存在的不足之處和未來的研究方向提出自己的觀點。本論文所用的開發(fā)平臺是微軟公司的vs2010和SQLServer2005,采用結(jié)構(gòu)化查詢語言T-SQL實現(xiàn)數(shù)據(jù)倉庫的建立和數(shù)據(jù)預(yù)處理,采用C++語言編程實現(xiàn)課程成績關(guān)聯(lián)關(guān)系的挖掘。關(guān)鍵詞:聚類分析,關(guān)聯(lián)規(guī)則,頻繁閉項集,散列技術(shù),事務(wù)矩陣萬方數(shù)據(jù)AbstractStudentscoreisnotonlyanintuitivereflectionoflearningquality
7、,butanimportantmeasurementoftheteachingquality.Thepurposeofdataminingisdiscoveryingthepotentiallyusefulknowledgefromalargenumberofincompleteandnoisydata.Discoveryingtheassociationamongvariouscoursesachievementthroughdataminingofthestudentscoreandrelateddataismeaningful.Som
8、eresearchoncoursescoreassociationofappliedmathematicsofOurschoolisdoneinthisthesis.Thethe