基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究

基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究

ID:31983276

大小:1.46 MB

頁數(shù):37頁

時間:2019-01-30

基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究_第1頁
基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究_第2頁
基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究_第3頁
基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究_第4頁
基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究_第5頁
資源描述:

《基于數(shù)據(jù)挖掘的決策樹技術在成績分析中的應用.研究》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。

1、山東大學碩士學位論文第一章緒論近十幾年來,數(shù)據(jù)挖掘技術已得到廣泛的研究,并在商業(yè)、金融、醫(yī)療等領域得到成功地應用。數(shù)據(jù)挖掘是信息處理領域的一項重要課題,它融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領域的理論和技術。其中分類分析在商業(yè)等領域中的成功應用使它成為數(shù)據(jù)挖掘中最活躍、最成熟的研究方向。目前常用的分類方法有決策樹、關聯(lián)規(guī)則、貝葉斯網(wǎng)絡、神經(jīng)網(wǎng)絡、粗糙集模型和統(tǒng)計模型等。而決策樹方法以其速度快、精度高、生成的模式簡單易懂以及容易轉化成分類規(guī)則等優(yōu)點,在數(shù)據(jù)挖掘領域被廣泛地研究和應用。由于高校連年擴招,造成了在校

2、生人數(shù)規(guī)模劇增,給高校的教學工作帶來了許多影響教學質量的問題。本論文以筆者所工作的學校為例,提出了一種應用決策樹技術來挖掘隱藏在學生成績背后有價值信息的研究方案,目的是對教師今后的教學工作提供重要的決策依據(jù)。決策樹技術是數(shù)據(jù)挖掘分類和預測的主要技術。是通過一組無次序、無規(guī)則的實例中推理出決策樹表現(xiàn)形式的分類規(guī)則。決策樹方法與其它分類方法相比具有可理解性、易訓練、易實施和通用性等優(yōu)點,所以本論文選擇將決策樹技術應用到學生成績分析研究中。1.1課題提出的研究背景及意義在高校教學中,教師在教學實施過程中往往積累了大量的數(shù)據(jù),

3、但目前對這些數(shù)據(jù)的處理還停留在初級的數(shù)據(jù)備份、查詢及簡單統(tǒng)計階段.不能發(fā)揮它應有的作用.如對學生成績的分析處理一般僅僅是統(tǒng)計成績?yōu)閮?yōu)、良、一般、差等級別的人數(shù),對于學生取得這些成績的原因往往無法了解.數(shù)據(jù)挖掘是一種決策支持過程.是深層次的數(shù)據(jù)信息分析方法.將數(shù)據(jù)挖掘技術應用于教學評價無疑是非常有益的,它可以全面地分析考試結果與各種因素之間隱藏的內在聯(lián)系,可以將大量的數(shù)據(jù)轉化為分類規(guī)則,從而更好地分析這些數(shù)據(jù)。必然有利于教學質量的提高。在激烈的市場競爭中,信息對于企業(yè)的生存和發(fā)展越來越起到至關重要的作用,隨著數(shù)據(jù)庫技術的

4、迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,數(shù)據(jù)庫中表達信息的數(shù)據(jù)亦隨著時間和業(yè)務的發(fā)展而急劇膨脹,人們需要對數(shù)據(jù)進行更高層8山東大學碩士學位論文暑量曼鼉曼曼量曼量曼鼉曼皇I—I_i_iIiI;II皇量毫量皇量皇詈曼詈曼皇魯曼量曼曼曼曼量曼皇曼量曼皇皇次的處理,從中找出規(guī)律和模式,以幫助人們更好的利用數(shù)據(jù)進行決策和研究。目前的數(shù)據(jù)庫系統(tǒng)雖然可以實現(xiàn)高效的數(shù)據(jù)錄入、查詢、統(tǒng)計等功能,卻無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。由于缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象,

5、面對“人們被數(shù)據(jù)淹沒,人們卻饑餓于知識’’的挑戰(zhàn),數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術應運而生,并得以蓬勃發(fā)展,越來越顯示出其強大的生命力。數(shù)據(jù)挖掘的核心部分是為數(shù)據(jù)集建立模型的過程,不同的數(shù)據(jù)挖掘方法構造數(shù)據(jù)模型的方式也不相同,在進行數(shù)據(jù)挖掘時可采用許多不同的方法,例如神經(jīng)網(wǎng)絡、決策樹、遺傳算法和可視化技術等,同時同一方法下又有數(shù)以百計的派生方法。決策樹算法是數(shù)據(jù)挖掘常用的方法之一,但它一直未受到人們重視,直到1984年Breiman等人合著出版了《分類和回歸樹》一書,決策樹方法才開始被統(tǒng)計學界接受并獲得了信賴,并很快得到推廣應用

6、?,F(xiàn)在很多公司的數(shù)據(jù)挖掘產(chǎn)品中都采用了決策樹數(shù)據(jù)挖掘算法,J.R.Quinlan對決策樹算法做出了詳細的理論描述‘1mmm2Ⅲ朝。決策樹算法中一種廣為人知的算法就是ID3算法,是1986年由Quinlan提出的一種基于信息熵的決策樹算法,近年來在很多知識發(fā)現(xiàn)領域得到應用,很多學者‘81啪omll針對ID3算法進行研究與改進。1.2國內外的研究現(xiàn)狀目前,決策樹技術己經(jīng)在許多數(shù)據(jù)挖掘系統(tǒng)應用中得到研究者和軟件公司的極大關注,國內外很多公司均己推出自己的數(shù)據(jù)挖掘系統(tǒng),其中很多都采用決策樹方法,而在Microsoft、SGI、

7、SAS昭兒“1在已推出的數(shù)據(jù)采掘系統(tǒng)中,首選的方法就是決策樹方法。SAS公司的SASEnterpriseMiner?1,是一種通用的數(shù)據(jù)挖掘工具,通過收集分析各種統(tǒng)計資料和客戶購買模式,幫助用戶發(fā)現(xiàn)業(yè)務的趨勢,解釋已知事實,預測未來結果,并識別完成任務所需關鍵因素,最終實現(xiàn)增加收入并降低成本的目的。IBM公司的IntelligentMiner嘲,具有典型數(shù)據(jù)集自動生成、關聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)現(xiàn)、概念性分類和可視化顯示等功能,可以自動實現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉換、數(shù)據(jù)發(fā)掘和結果顯示,必要時重復這一過程。Solution公司的Cl

8、ementine提供了一個可視化的快速建模環(huán)境,由數(shù)據(jù)獲取、挖掘、整理、建模和報告等部分組成。中科院計算技術研究所智能信息處理重點實驗室開發(fā)的MSMiner聆1是一種多策略知識發(fā)現(xiàn)平臺,能夠提供快捷有效的數(shù)據(jù)挖掘解決方案,9山東大學碩士學位論文提供多種知識發(fā)現(xiàn)方法。Angoss公司的KnowledgeSEEKER是一個基于決策樹的

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。