數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new

ID:18968595

大?。?02.16 KB

頁(yè)數(shù):14頁(yè)

時(shí)間:2018-09-27

數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new_第1頁(yè)
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new_第2頁(yè)
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new_第3頁(yè)
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new_第4頁(yè)
數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new_第5頁(yè)
資源描述:

《數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告new》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)

1、學(xué)生學(xué)號(hào)0120810680330實(shí)驗(yàn)課成績(jī)武漢理工大學(xué)學(xué)生實(shí)驗(yàn)報(bào)告書(shū)實(shí)驗(yàn)課程名稱數(shù)據(jù)挖掘開(kāi)課學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院指導(dǎo)老師姓名徐寧學(xué)生姓名趙倩學(xué)生專業(yè)班級(jí)軟件0803班2010—2011學(xué)年第二學(xué)期實(shí)驗(yàn)課程名稱:數(shù)據(jù)挖掘?qū)嶒?yàn)項(xiàng)目名稱數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)、實(shí)現(xiàn)及多維分析實(shí)驗(yàn)成績(jī)實(shí)驗(yàn)者趙倩專業(yè)班級(jí)軟件0803班組別同組者實(shí)驗(yàn)日期2011年5月19日第一部分:實(shí)驗(yàn)分析與設(shè)計(jì)一、實(shí)驗(yàn)內(nèi)容描述問(wèn)題描述:此實(shí)驗(yàn)為設(shè)計(jì)型實(shí)驗(yàn),選擇一種數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng),如SQLServerAnalysisManager進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)、實(shí)現(xiàn),并進(jìn)行多維數(shù)據(jù)分析。二、實(shí)驗(yàn)基本原理與設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)(

2、多維數(shù)據(jù)模型)AnalysisServerETLSQLServer2000數(shù)據(jù)庫(kù)DTS數(shù)據(jù)源學(xué)生信息管理系統(tǒng)、文本文件、電子表格三、主要儀器設(shè)備及軟件環(huán)境WindowsxpSQLServer2000第二部分:實(shí)驗(yàn)調(diào)試與結(jié)果分析一、調(diào)試過(guò)程(包括調(diào)試方法描述、實(shí)驗(yàn)數(shù)據(jù)記錄,實(shí)驗(yàn)現(xiàn)象記錄,實(shí)驗(yàn)過(guò)程發(fā)現(xiàn)的問(wèn)題等)如何向多維數(shù)據(jù)集添加度量值:度量值是要進(jìn)行分析的數(shù)據(jù)庫(kù)中的量化值。常用的度量值為銷售、成本和預(yù)算數(shù)據(jù)。度量值根據(jù)多維數(shù)據(jù)集不同的維度類別進(jìn)行分析。1.在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按鈕。2.在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟,展開(kāi)“教程”數(shù)據(jù)源

3、,然后單擊“sales_fact_1998”。3.單擊“瀏覽數(shù)據(jù)”按鈕可以查看“sales_fact_1998”表中的數(shù)據(jù)。數(shù)據(jù)瀏覽完畢后,關(guān)閉“瀏覽數(shù)據(jù)”窗口,然后單擊“下一步”按鈕。4.若要定義多維數(shù)據(jù)集的度量值,在“事實(shí)數(shù)據(jù)表數(shù)據(jù)列”下,雙擊“store_sales”。對(duì)“store_cost”和“unit_sales”列重復(fù)此步驟,然后單擊“下一步”按鈕。二、實(shí)驗(yàn)結(jié)果及分析(包括結(jié)果描述、實(shí)驗(yàn)現(xiàn)象分析、影響因素討論、綜合分析和結(jié)論等)運(yùn)行結(jié)果為:第一步,建立系統(tǒng)數(shù)據(jù)源連接第二步,啟動(dòng)AnalysisManager第三步,建立數(shù)據(jù)庫(kù)和數(shù)據(jù)源第四步建立多維數(shù)

4、據(jù)集1、如何建立時(shí)間維度2、如何建立產(chǎn)品維度3、如何建立客戶維度4、如何生成商店維度5、完成多維數(shù)據(jù)集的生成6、設(shè)計(jì)存儲(chǔ)和處理多維數(shù)據(jù)集7、瀏覽多維數(shù)據(jù)集數(shù)據(jù)(1)使用多維數(shù)據(jù)集瀏覽器查看多維數(shù)據(jù)集數(shù)據(jù)(2)替換網(wǎng)格中的維度(3)按時(shí)間篩選數(shù)據(jù)(4)深化三、實(shí)驗(yàn)小結(jié)、建議及體會(huì)基于“學(xué)生成績(jī)分析”主題數(shù)據(jù)倉(cāng)庫(kù)多維模型的建立,能很好地滿足高校老師和學(xué)生對(duì)學(xué)生成績(jī)信息進(jìn)行快速查詢以及分析的需要,為更多其他主題數(shù)據(jù)倉(cāng)庫(kù)的建立奠定了基礎(chǔ)。然而各主題數(shù)據(jù)倉(cāng)庫(kù)的建立,只是一個(gè)開(kāi)始,我們下一步工作將是在建立好的數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上進(jìn)行數(shù)據(jù)挖掘,進(jìn)一步去發(fā)現(xiàn)隱藏在這些學(xué)生成績(jī)信息數(shù)據(jù)

5、中更加有用的知識(shí)、規(guī)律和模式,使之為學(xué)校學(xué)生成績(jī)分析工作服務(wù)。將數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)用到學(xué)生信息管理中,使我了解了數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用以及如何創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù)。實(shí)驗(yàn)課程名稱:數(shù)據(jù)挖掘?qū)嶒?yàn)項(xiàng)目名稱Apriori算法實(shí)驗(yàn)成績(jī)實(shí)驗(yàn)者趙倩專業(yè)班級(jí)軟件0803班組別同組者實(shí)驗(yàn)日期2011年5月26日第一部分:實(shí)驗(yàn)分析與設(shè)計(jì)一、實(shí)驗(yàn)內(nèi)容描述(問(wèn)題域描述)此實(shí)驗(yàn)為綜合型實(shí)驗(yàn),要求學(xué)生綜合利用先修課程高級(jí)程序設(shè)計(jì)語(yǔ)言、數(shù)據(jù)庫(kù)、算法設(shè)計(jì)與分析,與本門(mén)數(shù)據(jù)挖掘課程的知識(shí),選擇一種編程工具,如VisualC++,實(shí)現(xiàn)經(jīng)典挖掘算法Apriori或算法k-Means。二、實(shí)驗(yàn)基本原理與設(shè)計(jì)(包括實(shí)驗(yàn)方案

6、設(shè)計(jì),實(shí)驗(yàn)手段的確定,試驗(yàn)步驟等,用硬件邏輯或者算法描述)Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。算法基于這樣的事實(shí):算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí)。Apriori使用一種稱作逐層搜索的迭代方法,k-項(xiàng)集用于探索(k+1)-項(xiàng)集。首先,找出頻繁1-項(xiàng)集的集合。該集合記作L1。L1用于找頻繁2-項(xiàng)集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k-項(xiàng)集。找每個(gè)Lk需要一次數(shù)據(jù)庫(kù)掃描。為了提高頻繁項(xiàng)目集逐層產(chǎn)生的效率,Apriori算法利用了兩個(gè)重要的性質(zhì)用于壓縮搜索空間:(l)若X是頻繁項(xiàng)集,則x的所有子集都是頻繁項(xiàng)集。(2)若

7、x是非頻繁項(xiàng)集,則X的所有超集都是非頻繁項(xiàng)集。2.2算法描述:算法:Apriori算法,使用逐層迭代找出頻繁項(xiàng)集。輸入:事務(wù)數(shù)據(jù)庫(kù)D;最小支持度閾值min_sup。輸出:D中的頻繁項(xiàng)集L。1)L1=find_frequent_1_itemsets(D);2)for(k=2;Lk-1≠;k++){3)Ck=aproiri_gen(Lk-1,min_sup);4)foreachtransactiontD{//scanDforcount5)Ct=subset(Ck,t);//getsubsetsoftthatarecandidates6)foreachcandidat

8、ecCt7)c.coun

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。