資源描述:
《鄰域粗糙集的屬性約簡算法及其在分類器中應用》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、分類號:TP391密級:無UDC:681學校代碼:11065碩士學位論文鄰域粗糙集的屬性約簡算法及其在分類器中應用郭功振指導教師劉遵仁副教授學科專業(yè)名稱軟件工程論文答辯日期2016年5月28日摘要近幾年,隨著互聯(lián)網(wǎng)技術的快速發(fā)展,大量企業(yè)開始關注業(yè)務所產生的數(shù)據(jù),紛紛建立起自己的數(shù)據(jù)倉庫,收集大量的數(shù)據(jù),以期通過處理這些數(shù)據(jù)獲得決策支持、創(chuàng)造新的價值。但隨著數(shù)據(jù)的不斷累積,信息處理的成本也不斷提升。而且這些數(shù)據(jù)往往還要講究時效性,如果沒有及時獲取數(shù)據(jù)中的價值,那么這些數(shù)據(jù)將會白白浪費大量的資源。因此怎樣從那些
2、累積如海的數(shù)據(jù)中高效獲取知識成為新的研究熱點。鄰域粗糙集既可以省掉繁瑣的離散化處理過程,直接作用于連續(xù)數(shù)據(jù),又能夠處理那些重復、不確定的數(shù)據(jù)。因此為了獲取更高的效率,本文所有工作將以鄰域粗糙集為基礎,從兩個方面進行改進,即降維和分類。因此,本文主要的任務為:(1)屬性約簡是鄰域粗糙集對數(shù)據(jù)進行降維的一種手段。本文將對屬性約簡中最為頻繁和最復雜的鄰域計算進行深入的分析和研究。然后根據(jù)數(shù)學推導得出的新性質,提出了改進的屬性約簡算法。該算法通過保存當前計算結果并用于下一次的計算,有效減少了鄰域的計算次數(shù)。經(jīng)過實驗驗
3、證,該算法對于提高鄰域計算的效率是有效的。(2)通過對現(xiàn)有的分類算法進行研究和分析,提出基于鄰域粗糙集的分類算法。該算法通過逐步添加屬性的方式進行迭代判斷類別,在保持與kNN算法同樣準確率的情況下,大幅度提高了分類算法的速度。關鍵字:粗糙集;鄰域;屬性約簡;分類;AbstractInrecentyears,withtherapiddevelopmentofInternettechnology,alargenumberofcompaniesbegantofocusonthedatageneratedbytheb
4、usiness.Theyhavesetuptheirowndatawarehousetocollectlargeamountsofdatainordertoobtainadecisionsupportandcreatenewvalue.Butwiththeaccumulationofdata,thecostofinformationprocessingisalsorising.Andthesedataareoftentime-sensitive.Ifyoudonotgetvaluefromthese,alot
5、ofresourceswillbewasted.Sohowtoacquireknowledgeinanefficientwayhasbecomeanewhotspotfromlargeamountsofdata.Neighborhoodroughsetcannotonlyhandleimprecise,inconsistentandincompletedata,butalsohasadirectroleincontinuousdata.Therefore,inordertoobtainhighereffici
6、ency,thispaperwillbebasedonneighborhoodroughsetandtwoaspects,dimensionalityreductionandclassification,willbeimproved.Themaintaskofthispaperisasfollows:1.Intheneighborhoodroughset,attributereductionisawayofdimensionalityreduction.Aparticularanalysisaboutthec
7、omplexoperationofcalculatingtheneighborhoodelementsofeachrecordinneighborhoodroughsetmodelisgiven.Thenthispaperalsodescribeshowtodeduceanewpropertybytheexistingproperties,andusingthenewpropertyimprovestheexistingattributereductionalgorithmtoreducethenumbero
8、fcomputingneighborhoods.Experimentalresultsshowthattheimprovedalgorithmiseffective.2.Throughtheexistingclassificationalgorithmsresearchandanalysis,thisarticlealsodescribesaclassificationalgorithmbasedo