數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件

ID:19491333

大?。?.50 MB

頁數(shù):68頁

時間:2018-10-02

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件_第5頁
資源描述:

《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘序論 ppt課件》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘主講教師:王浩暢E-mail:wanghch_angel@tom.comSchoolofComputer&InformationTechnologyofNEPU教科書和參考書教科書數(shù)據(jù)挖掘:概念與技術(shù),JiaweiHan和MichelineKamber著,機(jī)械工業(yè)出版社(2008)參考書J.HanandM.Kamber.DataMining:ConceptsandTechniques.2nded.機(jī)械工業(yè)出版社2006P.-N.Tan,M.SteinbachandV.Kumar,IntroductiontoDataMining.人民郵電出版社2005I.H.

2、WittenandE.Frank,DataMining:PracticalMachineLearningToolsandTechniques2nded.機(jī)械工業(yè)出版社2005課堂要求必須在打預(yù)備鈴前到教室,不得遲到、早退、曠課。遲到一次平時成績扣5分,曠課一次平時成績扣10分上課時必須關(guān)閉手機(jī),嚴(yán)禁在上課時間打電話、短信聊天。對擾亂課堂紀(jì)律的學(xué)生將責(zé)令退出課堂,并以曠課論處。缺課超過1/3不能參加考試期末成績=平時成績占10%+實(shí)驗(yàn)成績占10%+考試成績占80%第1章引言1.1數(shù)據(jù)挖掘的發(fā)展動力1.2什么是數(shù)據(jù)挖掘1.3對何種數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘1.4數(shù)據(jù)挖掘功能1.5所有模式都

3、是有趣的嗎1.6數(shù)據(jù)挖掘系統(tǒng)的分類1.7數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉庫技術(shù)的集成1.8數(shù)據(jù)挖掘的主要問題數(shù)據(jù)挖掘的發(fā)展動力(1)需要是發(fā)明之母數(shù)據(jù)爆炸問題自動數(shù)據(jù)收集工具和成熟的數(shù)據(jù)庫技術(shù)使得大量的數(shù)據(jù)被收集,存儲在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中以待分析。我們擁有豐富的數(shù)據(jù),但卻缺乏有用的信息解決方法:數(shù)據(jù)倉庫技術(shù)和數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)倉庫(DataWarehouse)和在線分析處理(OLAP)數(shù)據(jù)挖掘:在大量的數(shù)據(jù)中挖掘感興趣的知識(規(guī)則,規(guī)律,模式,約束)數(shù)據(jù)挖掘的發(fā)展動力(2)數(shù)據(jù)庫技術(shù)的演化1960s和以前:文件系統(tǒng)1970s:層次數(shù)據(jù)庫和網(wǎng)狀數(shù)據(jù)庫1980s早期:關(guān)系數(shù)據(jù)模型,

4、關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)的實(shí)現(xiàn)數(shù)據(jù)挖掘的發(fā)展動力(3)1980s晚期:各種高級數(shù)據(jù)庫系統(tǒng)(擴(kuò)展的關(guān)系數(shù)據(jù)庫,面向?qū)ο髷?shù)據(jù)庫等等.)面向應(yīng)用的數(shù)據(jù)庫系統(tǒng)(空間數(shù)據(jù)庫,時序數(shù)據(jù)庫,多媒體數(shù)據(jù)庫等等)1990s:數(shù)據(jù)挖掘,數(shù)據(jù)倉庫,多媒體數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫2000s流數(shù)據(jù)管理和挖掘基于各種應(yīng)用的數(shù)據(jù)挖掘XML數(shù)據(jù)庫和整合的信息系統(tǒng)第1章引言1.1數(shù)據(jù)挖掘的發(fā)展動力1.2什么是數(shù)據(jù)挖掘1.3對何種數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘1.4數(shù)據(jù)挖掘功能1.5所有模式都是有趣的嗎1.6數(shù)據(jù)挖掘系統(tǒng)的分類1.7數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉庫技術(shù)的集成1.8數(shù)據(jù)挖掘的主要問題什么是數(shù)據(jù)挖掘?(1)數(shù)據(jù)挖掘(從數(shù)

5、據(jù)中發(fā)現(xiàn)知識)從大量的數(shù)據(jù)中挖掘哪些令人感興趣的、有用的、隱含的、先前未知的和可能有用的模式或知識挖掘的不僅僅是數(shù)據(jù)(所以“數(shù)據(jù)挖掘”并非一個精確的用詞)數(shù)據(jù)挖掘的替換詞數(shù)據(jù)庫中的知識挖掘(KDD)知識提煉、數(shù)據(jù)/模式分析數(shù)據(jù)考古數(shù)據(jù)捕撈、信息收獲等等。并非所有東西都是“數(shù)據(jù)挖掘”查詢處理.專家系統(tǒng)或是小型的數(shù)學(xué)計(jì)算/統(tǒng)計(jì)程序什么是數(shù)據(jù)挖掘?(2)數(shù)據(jù)挖掘的應(yīng)用數(shù)據(jù)分析和決策支持市場分析和管理目標(biāo)市場,客戶關(guān)系管理(CRM),市場占有量分析,交叉銷售,市場分割風(fēng)險分析和管理風(fēng)險預(yù)測,客戶保持,保險業(yè)的改良,質(zhì)量控制,競爭分析欺騙檢測和異常模式的監(jiān)測(孤立點(diǎn))其他的應(yīng)用文本挖掘

6、(新聞組,電子郵件,文檔)和WEB挖掘流數(shù)據(jù)挖掘DNA和生物數(shù)據(jù)分析等等。什么是數(shù)據(jù)挖掘?(3)數(shù)據(jù)挖掘應(yīng)用—市場分析和管理(1)數(shù)據(jù)從那里來?信用卡交易,會員卡,商家的優(yōu)惠卷,消費(fèi)者投訴電話,公眾生活方式研究目標(biāo)市場構(gòu)建一系列的“客戶群模型”,這些顧客具有相同特征:興趣愛好,收入水平,消費(fèi)習(xí)慣,等等確定顧客的購買模式交叉市場分析貨物銷售之間的相互聯(lián)系和相關(guān)性,以及基于這種聯(lián)系上的預(yù)測什么是數(shù)據(jù)挖掘?(4)數(shù)據(jù)挖掘應(yīng)用—市場分析和管理(2)顧客分析哪類顧客購買那種商品(聚類分析或分類預(yù)測)客戶需求分析確定適合不同顧客的最佳商品預(yù)測何種因素能夠吸引新顧客提供概要信息多維度的綜合

7、報告統(tǒng)計(jì)概要信息(數(shù)據(jù)的集中趨勢和變化)什么是數(shù)據(jù)挖掘?(5)數(shù)據(jù)挖掘應(yīng)用—公司分析和風(fēng)險管理財(cái)務(wù)計(jì)劃現(xiàn)金流轉(zhuǎn)分析和預(yù)測交叉區(qū)域分析和時間序列分析(財(cái)務(wù)資金比率,趨勢分析等等)資源計(jì)劃總結(jié)和比較資源和花費(fèi)競爭對競爭者和市場趨勢的監(jiān)控將顧客按等級分組和基于等級的定價過程將定價策略應(yīng)用于競爭更激烈的市場中什么是數(shù)據(jù)挖掘?(6)數(shù)據(jù)挖掘應(yīng)用—欺詐行為檢測和異常模式的發(fā)現(xiàn)(1)方法:對欺騙行為進(jìn)行聚類和建模,并進(jìn)行孤立點(diǎn)分析應(yīng)用:衛(wèi)生保健、零售業(yè)、信用卡服務(wù)、電信等汽車保險:相撞事件的分析洗錢:發(fā)現(xiàn)可疑的貨幣交

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。