資源描述:
《基于分類模型的知識(shí)發(fā)現(xiàn)機(jī)理和方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、V93S二S3博士學(xué)位論文基于分類模型的知識(shí)發(fā)現(xiàn)機(jī)理和方法研究作者姓名:學(xué)科專業(yè):學(xué)院(系、所):指導(dǎo)教師:蒙祖強(qiáng)計(jì)算機(jī)應(yīng)用技術(shù)信息科學(xué)與工程學(xué)院蔡自興教授中南大學(xué)Z-00四年十一月捅望樣,與DA.FPR算法一起,這三個(gè)算法的有機(jī)結(jié)合就構(gòu)成了個(gè)性化知識(shí)發(fā)現(xiàn)的一個(gè)完整的解決方法—斗KDA算法。PKDA算法通過(guò)層層去除用戶不感興趣信息的方法,最終發(fā)現(xiàn)符合用戶需要的個(gè)性化知識(shí)。從而為當(dāng)前KDD領(lǐng)域中的研究熱點(diǎn)之一——“發(fā)現(xiàn)用戶感興趣的知識(shí)”,作出貢獻(xiàn)。從分析進(jìn)化計(jì)算的產(chǎn)生根源入手,探討了以人類迸化為核心的文化進(jìn)化機(jī)制,首次提出粒度進(jìn)化計(jì)算(GEC),它包括群
2、進(jìn)化和超群進(jìn)化,是兩者的有機(jī)結(jié)合。如果說(shuō)進(jìn)化計(jì)算是模擬達(dá)爾文生物進(jìn)化機(jī)制而發(fā)展起來(lái)的一種計(jì)算方法,那么粒度進(jìn)化計(jì)算則是在模仿文化進(jìn)化機(jī)制的基礎(chǔ)上,綜合了Agent技術(shù)以及粒度計(jì)算、進(jìn)化計(jì)算的理論和方法而提出的一種智能計(jì)算方法。較之生物進(jìn)化,文化進(jìn)化速度快、效果佳,其中必蘊(yùn)藏著非常有效的機(jī)制。所以探討這種進(jìn)化機(jī)制有望為一些復(fù)雜問(wèn)題的解決提供一種新的方法。針對(duì)KDD算法存在的早熟收斂性和低效性等問(wèn)題,在深入分析基于進(jìn)化計(jì)算的KDD算法研究進(jìn)展和研究成果的基礎(chǔ)上,利用粒度進(jìn)化的基本思想,以MAS為支撐技術(shù),提出并設(shè)計(jì)了面向分類問(wèn)題的粒度進(jìn)化算法(GEA)。G
3、EA算法不但能夠把復(fù)雜的搜索問(wèn)題轉(zhuǎn)化為若干個(gè)簡(jiǎn)單的搜索問(wèn)題,減少問(wèn)題的計(jì)算復(fù)雜性,加快收斂過(guò)程,提高算法效率,而且使得在進(jìn)化過(guò)程中把Michigan方法和Pittsburgh方法的優(yōu)點(diǎn)有機(jī)地結(jié)合起來(lái),有效保持個(gè)體的多樣性,減少算法陷入局部最優(yōu)的機(jī)會(huì),提高其全局搜索能力。實(shí)驗(yàn)表明,粒度進(jìn)化算法在這面的性能優(yōu)于已有方法??傊?,本文基于分類模型利用粒度計(jì)算的基本原理,研究信息系統(tǒng)知識(shí)空間的結(jié)構(gòu)特性和代數(shù)性質(zhì),從而分析知識(shí)的形成機(jī)理,進(jìn)一步豐富和完善知識(shí)發(fā)現(xiàn)的理論體系。在深入研究現(xiàn)有的知識(shí)發(fā)現(xiàn)方法的基礎(chǔ)上,對(duì)“發(fā)現(xiàn)用戶感興趣的知識(shí)”、知識(shí)發(fā)現(xiàn)算法的早熟收斂和局
4、部知識(shí)的產(chǎn)生問(wèn)題,以及效率和分類準(zhǔn)確率問(wèn)題等進(jìn)行了研究,提出相應(yīng)的解決方法。文中,對(duì)提出的重要定理和性質(zhì),都作了論證和說(shuō)明;對(duì)提出的有關(guān)算法,都給出了實(shí)驗(yàn)結(jié)果及其分析,證實(shí)算法的有效性。最后,把本文提出的算法集成起來(lái),開發(fā)了一個(gè)知識(shí)發(fā)現(xiàn)原型系統(tǒng)一一MKDD系統(tǒng),這在附錄中作了簡(jiǎn)單介紹。這些工作不僅對(duì)促進(jìn)KDD的理論和方法的研究具有意義、拓展了傳統(tǒng)的知識(shí)發(fā)現(xiàn)方法,而且在“科技轉(zhuǎn)化為生產(chǎn)力”和我國(guó)的商業(yè)智能化方面也具有一定應(yīng)用價(jià)值。關(guān)鍵詞:知識(shí)發(fā)現(xiàn),分類模型,約簡(jiǎn),粒度計(jì)算,決策樹,粗糙集,粒度進(jìn)化計(jì)算,AgentII中南大學(xué)博士學(xué)位論文ABSTRACTK
5、DD,KnowledgeDiscoveryinDatabase,isanoveltechnologyofintelligentinformationprocessingforknowledgediscoveryinlargedatabase.First,independentofidiographicalgorithms,mechanismofKDDbasedonclassificationmodelisstudiedwithGranularComputationaftersystematicallyreviewingrelatedwork;andru
6、n-of-milllawsaredrownout.Thentheoriginofsomeexistingproblemsisanalysed.Secondly,newtheoryandmethodofKDDareproposedwiththoroug}lresearchesonalotscalculationmethods.Asamsult,PKDD(PersonalizedKnowledgeDiscoveryinDatabase),problemsofefficiencyandaccuracy,prematureconvergenceofsomeKD
7、Dalgorithmsareresearchedandresolved.Theprimaryworkandcontributionsinthisdissertationareasfollows.All-Granular-Space,writtenasAllGS,andSuper-Granular-Space,writtenass_Gs,ofinformationsystemarebuilt;andthenalgebraicsystem,BooleanAlgebra,andlatticeareobtained.Takingadvantageofthepr
8、opertiesoflattice,structuralmodelofAllGS,whichi