資源描述:
《《數(shù)據(jù)挖掘》PPT課件》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、數(shù)據(jù)挖掘在智能信息系統(tǒng)中的應(yīng)用研究吳渝@重慶郵電學(xué)院計(jì)算機(jī)學(xué)院2004.12目錄數(shù)據(jù)挖掘簡介數(shù)據(jù)挖掘研究平臺技術(shù)海量數(shù)據(jù)挖掘應(yīng)用研究電子郵件智能分析網(wǎng)絡(luò)入侵檢測研究展望2數(shù)據(jù)挖掘簡介實(shí)例應(yīng)用工具3什么是數(shù)據(jù)挖掘通過采用自動(dòng)或半自動(dòng)的手段,在海量數(shù)據(jù)中發(fā)現(xiàn)有意義的行為和規(guī)則的探測和分析活動(dòng)。數(shù)據(jù)挖掘是從數(shù)據(jù)中自動(dòng)地抽取模式、關(guān)聯(lián)、變化、異常和有意義的結(jié)構(gòu)海量數(shù)據(jù)數(shù)據(jù)挖掘知識庫4實(shí)例全球最大的零售商沃爾瑪(Walmart):星期四、啤酒與尿布銷售額上漲了30%英國電信通過直郵的方式向客戶推薦新產(chǎn)品使
2、直回應(yīng)率提高了100%匯豐銀行分類客戶群,對每種產(chǎn)品找出最有價(jià)值的客戶營銷費(fèi)用減少了30%5應(yīng)用舉例電信:客戶流失百貨公司/超市:購物籃分析保險(xiǎn):交叉銷售,流失信用卡:欺詐探測電子商務(wù):網(wǎng)站日志分析,個(gè)性化服務(wù)稅務(wù)部門:偷漏稅行為探測警察機(jī)關(guān):犯罪行為分析醫(yī)學(xué):醫(yī)療保健,病癥原因分析6應(yīng)用比例7商業(yè)工具:SPSSClementine8豐富的數(shù)據(jù)挖掘算法PredictionNeuralnet,C5.0ClassificationNeuralnet,C5.0SegmentationKohonen
3、,Kmeans,C5.0AssociationApriori,GRI,WebgraphSequenceCaprI,NeuralNet,Regression9價(jià)格?SPSSClementine7.2中文版校園方案租賃優(yōu)惠買斷優(yōu)惠(臺幣)教授個(gè)人研究使用(1人)225000395000(10萬RMB)教學(xué)專用版(10人)335000595000教學(xué)專用版(25人)449000795000(20萬RMB)1人民幣=3.908臺幣10數(shù)據(jù)挖掘研究回顧技術(shù)11數(shù)據(jù)挖掘歷史回顧1989IJCAIWorksh
4、oponKnowledgeDiscoveryinDatabasesKnowledgeDiscoveryinDatabases(G.Piatetsky-ShapiroandW.Frawley,1991)1991-1994WorkshopsonKnowledgeDiscoveryinDatabasesAdvancesinKnowledgeDiscoveryandDataMining(U.Fayyad,G.Piatetsky-Shapiro,P.Smyth,andR.Uthurusamy,1996)1
5、995-1998InternationalConferencesonKnowledgeDiscoveryinDatabasesandDataMining(KDD’95-98)JournalofDataMiningandKnowledgeDiscovery(1997)1998ACMSIGKDD,SIGKDD’1999-2001conferences,andSIGKDDExplorationsMoreconferencesondataminingPAKDD,PKDD,SIAM-DataMining,
6、(IEEE)ICDM,DaWaK,SPIE-DM,etc.12相關(guān)技術(shù)DataMiningDatabaseTechnologyStatisticsOtherDisciplinesInformationScienceMachineLearning(AI)Visualization13數(shù)據(jù)挖掘的不同視角DatabasestobeminedRelational,transactional,object-relational,active,spatial,time-series,text,multi-m
7、edia,heterogeneous,legacy,WWW,etc.KnowledgetobeminedCharacterization,discrimination,association,classification,clustering,trend,deviationandoutlieranalysis,etc.TechniquesutilizedDatabase-oriented,datawarehouse(OLAP),machinelearning,statistics,visuali
8、zation,neuralnetwork,etc.ApplicationsadaptedRetail,telecommunication,banking,fraudanalysis,DNAmining,stockmarketanalysis,Webmining,Webloganalysis,etc.14預(yù)言模型文化(PM)輸出的是預(yù)言模型知識發(fā)現(xiàn)文化(KD)輸出的是規(guī)則數(shù)據(jù)挖掘文化共同點(diǎn)兩種文化輸入的都是學(xué)習(xí)集(learningsets)目的都是盡可能多的自動(dòng)化數(shù)據(jù)挖掘過程數(shù)據(jù)挖掘過程并不能完全