資源描述:
《基于數(shù)據(jù)倉庫的聯(lián)機分析挖掘》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、華東理工大學碩士學位論文第I頁基于數(shù)據(jù)倉庫的聯(lián)機分析挖掘摘要本文在分析數(shù)據(jù)挖掘、聯(lián)機分析的主要技術、應用狀況、研究熱點的基礎上,提出了將聯(lián)機分析和數(shù)據(jù)挖掘有機結合起來的體系結構一聯(lián)機分析挖掘。首先針對具體應用數(shù)據(jù)的特點以及聯(lián)機分析挖掘的要求進行數(shù)據(jù)預處理,并將處理結果以數(shù)據(jù)倉庫的結構形式予以存儲;然后在深入分析關聯(lián)規(guī)則挖掘技術的基礎上,針對數(shù)據(jù)倉庫中數(shù)據(jù)頻繁更新的特點,提出了增量式多維關聯(lián)規(guī)則挖掘算法,并通過實驗數(shù)據(jù)對挖擁算法的有效,睦進行了驗證;接著根據(jù)數(shù)據(jù)挖掘和聯(lián)機分析各自的特點以及它們相結合的
2、可能性和必要性,將聯(lián)機分析和數(shù)據(jù)挖掘有機的集成為一體,使數(shù)據(jù)限定在較小的尋找規(guī)則的范圍內(nèi),以發(fā)現(xiàn)用戶感興趣的規(guī)則,并實現(xiàn)聯(lián)機分析與數(shù)據(jù)挖掘的動態(tài)交互;最后以浦東財政局數(shù)據(jù)倉庫項目為應用背景,使用聯(lián)機分析挖掘思想挖掘出大量有用的且用戶感興趣的規(guī)則,取得了較為理想的效果。關鍵詞:聯(lián)機挖掘多維關聯(lián)纓一增替數(shù)想多庫第n頁華東理工大學碩士學位論文TheOnlineAnalyticalMiningBasedonDataWarehouseAbstractThispaperintroducestheDataMing
3、andOn-lineAnalyticalProcessing'srn,lintechniques,即plicationsandresearchinghotspots,bringsforwardanewarchitechtureOLAM(On-lineAnalyticalMining).Firstofall,accordingtothespecicaldatacharacteristicofOLAM,thedatapreprocessingisperformed,anddataisorganizeds
4、tar-schemaandstoredindatawarehouse.Afterpenetratingintothestudyofassociationrulesmining,anincrementalassociationrulesminingformuliti-dimensionaldataisputforward,andprovedforit'svalidityandsuperioritybyexperiment.Then,thepaperanalyzestheadvantageanddisa
5、dvantageofdataminingandon-lineanalyticalprocessingrespectively,thepossibilityandnecessityoftwotechniques'integration,andconstructsthemintoanorganicsystem.Thissystemcanrestrictthedataintoalesserrangeandfindinterestedrulesforcustomer.Furthermore,on-linea
6、nalyticalprocessinganddataminingcancaryoutaltemantlyandinteracteachother.Intheend,basedonthePudongFinancialdatawarehouseproject,alotofusefulandinterestedassociationrulesisdiscovered勿thesystemKeywords:multi-dimensionalassociationrulesincrementaldataware
7、houseonlineanalyticalmining作者聲明我鄭重聲明:本人格守學術道德,崇尚嚴謹學風。所呈交的學位論文,是本人在導師的指導下,獨立進行研究工作所取得的結果。除文中明確注明和引用的內(nèi)容外,本論文不包含任何他人己經(jīng)發(fā)表或撰寫過的內(nèi)容。論文為本人親自撰寫,并對所寫內(nèi)容負責。論文作者簽名:尾客2002年12月26日華東理工大學碩士學位論文第1頁第1章緒論近年來,隨著數(shù)據(jù)庫技術的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,人類積篆的數(shù)據(jù)量以指數(shù)速度增長。這些海量數(shù)據(jù)背后隱藏著許多重要的信息,人們
8、希望能夠對其進行更高層次的分析,以便更好地利用這些數(shù)據(jù)。數(shù)據(jù)庫系統(tǒng)可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。于是,在這被稱為信息爆炸的時代,信息過量幾乎成為人人需要面對的問題川。一個新的挑戰(zhàn)被提了出來:如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,從而提高信息利用率呢?面對“數(shù)據(jù)爆炸但知識貧乏”這一現(xiàn)象,聯(lián)機分析、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等知識發(fā)現(xiàn)技術[a7應運而生。知識發(fā)現(xiàn)技術是人們長期對