資源描述:
《鄰域粗糙集的屬性約簡(jiǎn)算法及其在分類器中應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、分類號(hào):TP391密級(jí):無(wú)UDC:681學(xué)校代碼:11065碩士學(xué)位論文鄰域粗糙集的屬性約簡(jiǎn)算法及其在分類器中應(yīng)用郭功振指導(dǎo)教師劉遵仁副教授學(xué)科專業(yè)名稱軟件工程論文答辯日期2016年5月28日摘要近幾年,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大量企業(yè)開(kāi)始關(guān)注業(yè)務(wù)所產(chǎn)生的數(shù)據(jù),紛紛建立起自己的數(shù)據(jù)倉(cāng)庫(kù),收集大量的數(shù)據(jù),以期通過(guò)處理這些數(shù)據(jù)獲得決策支持、創(chuàng)造新的價(jià)值。但隨著數(shù)據(jù)的不斷累積,信息處理的成本也不斷提升。而且這些數(shù)據(jù)往往還要講究時(shí)效性,如果沒(méi)有及時(shí)獲取數(shù)據(jù)中的價(jià)值,那么這些數(shù)據(jù)將會(huì)白白浪費(fèi)大量的資源。因此怎樣從那些
2、累積如海的數(shù)據(jù)中高效獲取知識(shí)成為新的研究熱點(diǎn)。鄰域粗糙集既可以省掉繁瑣的離散化處理過(guò)程,直接作用于連續(xù)數(shù)據(jù),又能夠處理那些重復(fù)、不確定的數(shù)據(jù)。因此為了獲取更高的效率,本文所有工作將以鄰域粗糙集為基礎(chǔ),從兩個(gè)方面進(jìn)行改進(jìn),即降維和分類。因此,本文主要的任務(wù)為:(1)屬性約簡(jiǎn)是鄰域粗糙集對(duì)數(shù)據(jù)進(jìn)行降維的一種手段。本文將對(duì)屬性約簡(jiǎn)中最為頻繁和最復(fù)雜的鄰域計(jì)算進(jìn)行深入的分析和研究。然后根據(jù)數(shù)學(xué)推導(dǎo)得出的新性質(zhì),提出了改進(jìn)的屬性約簡(jiǎn)算法。該算法通過(guò)保存當(dāng)前計(jì)算結(jié)果并用于下一次的計(jì)算,有效減少了鄰域的計(jì)算次數(shù)。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)
3、證,該算法對(duì)于提高鄰域計(jì)算的效率是有效的。(2)通過(guò)對(duì)現(xiàn)有的分類算法進(jìn)行研究和分析,提出基于鄰域粗糙集的分類算法。該算法通過(guò)逐步添加屬性的方式進(jìn)行迭代判斷類別,在保持與kNN算法同樣準(zhǔn)確率的情況下,大幅度提高了分類算法的速度。關(guān)鍵字:粗糙集;鄰域;屬性約簡(jiǎn);分類;AbstractInrecentyears,withtherapiddevelopmentofInternettechnology,alargenumberofcompaniesbegantofocusonthedatageneratedbytheb
4、usiness.Theyhavesetuptheirowndatawarehousetocollectlargeamountsofdatainordertoobtainadecisionsupportandcreatenewvalue.Butwiththeaccumulationofdata,thecostofinformationprocessingisalsorising.Andthesedataareoftentime-sensitive.Ifyoudonotgetvaluefromthese,alot
5、ofresourceswillbewasted.Sohowtoacquireknowledgeinanefficientwayhasbecomeanewhotspotfromlargeamountsofdata.Neighborhoodroughsetcannotonlyhandleimprecise,inconsistentandincompletedata,butalsohasadirectroleincontinuousdata.Therefore,inordertoobtainhighereffici
6、ency,thispaperwillbebasedonneighborhoodroughsetandtwoaspects,dimensionalityreductionandclassification,willbeimproved.Themaintaskofthispaperisasfollows:1.Intheneighborhoodroughset,attributereductionisawayofdimensionalityreduction.Aparticularanalysisaboutthec
7、omplexoperationofcalculatingtheneighborhoodelementsofeachrecordinneighborhoodroughsetmodelisgiven.Thenthispaperalsodescribeshowtodeduceanewpropertybytheexistingproperties,andusingthenewpropertyimprovestheexistingattributereductionalgorithmtoreducethenumbero
8、fcomputingneighborhoods.Experimentalresultsshowthattheimprovedalgorithmiseffective.2.Throughtheexistingclassificationalgorithmsresearchandanalysis,thisarticlealsodescribesaclassificationalgorithmbasedo