資源描述:
《云理論及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、出入侵決策‘柏1。另外,在定性評(píng)價(jià)【411和預(yù)測(cè)中【42】云理論有一定的應(yīng)用。1.3論文的主要工作本文針對(duì)云理論處理不確定性問(wèn)題,考慮到梯形云模型在生活中表示概念更具一般性,對(duì)梯形云的性質(zhì)及應(yīng)用進(jìn)行了研究,并對(duì)云理論的在數(shù)據(jù)挖掘中應(yīng)用進(jìn)行了探討。論文完成的主要以下幾個(gè)方面:(1)系統(tǒng)闡述了梯形云模型的數(shù)字特征,期望曲線等重要性質(zhì),給出了梯形云發(fā)生器算法,并對(duì)梯形云模型和正態(tài)云模型的聯(lián)系與區(qū)別進(jìn)行了探討。(2)將梯形云模型引入到數(shù)量型屬性的概念劃分中,提出了新的基于云變換的云概念劃分算法。此算法得到的概念反映了此屬性中數(shù)據(jù)在
2、定義域中的實(shí)際分布,同時(shí)概念的邊界是模糊的,不確定的,因而是一種軟劃分方法。(3)在云概念劃分的基礎(chǔ)上,提出了云關(guān)聯(lián)規(guī)則提取方法.云概念劃分實(shí)現(xiàn)數(shù)量型屬性的軟劃分,從而使得挖掘出的關(guān)聯(lián)規(guī)則具有有效性和可理解性。(4)基于云模型的不確定性推理,對(duì)云模型在定性評(píng)價(jià)方面的應(yīng)用進(jìn)行了研究。結(jié)合實(shí)例,給出了兩個(gè)具體評(píng)價(jià)模型.1.4論文的組織結(jié)構(gòu)本文針對(duì)云理論處理不確定性問(wèn)題,圍繞云理論及其應(yīng)用,逐步展開(kāi)全面而深入的研究。本文各章節(jié)的安排如下:第一章緒論介紹了論文的選題背景,闡述了論文的選題意義,并對(duì)本課題的國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了介紹。
3、第二章數(shù)據(jù)挖掘概述首先詳細(xì)闡述了數(shù)據(jù)挖掘的定義,研究了數(shù)據(jù)挖掘的過(guò)程。接著,對(duì)數(shù)據(jù)挖掘中普遍存在的不確定性現(xiàn)象展開(kāi)了深入、詳盡的討論,分析了產(chǎn)生不確定性的原因,歸納總結(jié)、對(duì)比討論了常用的處理不確定性的方法。第三章云理論4本章對(duì)云理論的基本概念和相關(guān)方法進(jìn)行必要的闡述。對(duì)正態(tài)云及發(fā)生器、基于云模型的推理機(jī)制進(jìn)行了詳細(xì)分析。第四章梯形云模型本章分析了梯形云模型的相關(guān)重要性質(zhì)和發(fā)生器算法,比較了正態(tài)云與梯形云的不同;將梯形云模型引入到概念劃分中,形成是一種屬性空間的軟劃分算法:在新的概念劃分算法上提出了云關(guān)聯(lián)規(guī)則挖掘方法。第五章
4、基于云模型的不確定性評(píng)價(jià)本章對(duì)生活中常用定性評(píng)價(jià)方法的不足和教育及其評(píng)估的不確定性進(jìn)了探討,在此基礎(chǔ)上,利用云模型的不確定推理機(jī)制提出了兩個(gè)評(píng)估模型。第六章總結(jié)對(duì)論文工作進(jìn)行了總結(jié),對(duì)后續(xù)研究進(jìn)行了展望。52.1數(shù)據(jù)挖掘概述第二章數(shù)據(jù)挖掘技術(shù)隨著數(shù)據(jù)庫(kù)的迅速發(fā)展以及人們對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,積累的數(shù)據(jù)越來(lái)越多,手工分析如此龐大的數(shù)據(jù)庫(kù)并及時(shí)得到有價(jià)值的結(jié)果顯然是不可能的。為實(shí)現(xiàn)用智能化的方法自動(dòng)從大量的數(shù)據(jù)中迅速發(fā)現(xiàn)有用的知識(shí),必須尋找更有效的工具和技術(shù)。隨著人工智能的發(fā)展,出現(xiàn)了機(jī)器學(xué)習(xí),它是采用計(jì)算機(jī)模擬人類學(xué)習(xí)
5、的一門(mén)科學(xué),人們用數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)數(shù)據(jù),用機(jī)器學(xué)習(xí)的方法來(lái)分析數(shù)據(jù),挖掘大量數(shù)據(jù)背后的知識(shí),這兩者的結(jié)合形成了知識(shí)發(fā)現(xiàn)KDD(KnowledgeDiscoveryinDatabase)t431。整個(gè)知識(shí)挖掘過(guò)程是由若干挖掘步驟組成的,而數(shù)據(jù)挖掘僅是其中一個(gè)主要步驟淵.知識(shí)挖掘的主要步驟有:數(shù)據(jù)清洗(datacleaning).其作用是清除數(shù)據(jù)噪聲和與主題明顯無(wú)關(guān)的數(shù)據(jù);數(shù)據(jù)集成(dataintegration):其作用是將來(lái)自多數(shù)據(jù)源中的相關(guān)數(shù)據(jù)組合到一起;數(shù)據(jù)轉(zhuǎn)換(datatransformation):其作用是將數(shù)據(jù)轉(zhuǎn)換為
6、易于進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)存儲(chǔ)形式;數(shù)據(jù)挖掘(datamining):它就是知識(shí)挖掘的一個(gè)基本步驟,其作用就是利用智能方法挖掘數(shù)據(jù)模式或規(guī)律知識(shí):.模式評(píng)估(patternevaluation):其作用就是根據(jù)一定評(píng)估標(biāo)準(zhǔn)從挖掘結(jié)果篩選出有意義的模式知識(shí);知識(shí)表示(knowledgepresentation):其作用就是利用可視化和知識(shí)表達(dá)技術(shù),想用戶展示所挖掘出的相關(guān)知識(shí)。數(shù)據(jù)挖掘是KDD最核心的部分,是采用機(jī)器學(xué)習(xí)、統(tǒng)計(jì)等方法進(jìn)行知識(shí)學(xué)習(xí)的階段。數(shù)據(jù)挖掘算法的好壞將直接影響到所發(fā)現(xiàn)知識(shí)的好壞。盡管數(shù)據(jù)挖掘僅僅是整個(gè)知識(shí)挖掘
7、過(guò)程中的一個(gè)重要步驟,但是由于“數(shù)據(jù)挖掘一己經(jīng)被廣泛使用并被普遍接受,廣義地使用“數(shù)據(jù)挖掘"一詞來(lái)表示整個(gè)知識(shí)挖掘過(guò)程,數(shù)據(jù)挖掘(DataMining)就是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。6廣西大攀碩士掌位。淪文自1995年舉辦了國(guó)際第一屆知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘?qū)W術(shù)會(huì)議,會(huì)議上明確定義知識(shí)發(fā)現(xiàn)后,數(shù)據(jù)挖掘逐步廣泛應(yīng)用于各個(gè)領(lǐng)域:如在地理數(shù)據(jù)庫(kù)上挖掘地質(zhì)、地貌特征,尋找礦產(chǎn)或進(jìn)行城市規(guī)劃;針對(duì)生物醫(yī)學(xué)和DNA數(shù)據(jù)分析,挖掘遺傳、疾病等數(shù)據(jù)
8、特征;對(duì)金融數(shù)據(jù)進(jìn)行挖掘,分析客戶信用度:在電信業(yè)中使用挖掘方法,預(yù)防網(wǎng)絡(luò)欺詐;對(duì)零售業(yè)中的數(shù)據(jù)進(jìn)行挖掘,指導(dǎo)安排貨架和商品排放次序:在Wcb服務(wù)器上挖掘web日志,根據(jù)用戶興趣動(dòng)態(tài)鏈接,統(tǒng)計(jì)權(quán)威主頁(yè)等,并可對(duì)檢索頁(yè)面進(jìn)行聚類,方便用戶找到需要的信息:在CRM(客戶關(guān)系管理)中使用數(shù)據(jù)挖掘,獲得客戶群體