資源描述:
《基于空間旋轉(zhuǎn)的支持向量機(jī)改進(jìn)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、TP3-010058'"變班.^3'^',F瑚蒜j?為扁巧瞧隱;.?.、…w,>?.ill!廉琴闘麟:..而-…?《一-挪-心‘?一策-,叫;論文題目:基于空間旋轉(zhuǎn)的支持向量機(jī).改進(jìn)雛巧聽(tīng)^糸■學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù);作者姓名:田佳林I-,.寺指導(dǎo)教師陳科副教授:藝二Q一二月?完成曰期五年十:獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作和取得的研究成果,除了文中特別加W標(biāo)注和致謝之處外,論文中不包含其他人己經(jīng)發(fā)表或
2、撰寫(xiě)巧的研究成果,化不巧含為獲得天津工業(yè)大學(xué)或其佈教育機(jī)構(gòu)的挙化或.證書(shū)而使用過(guò)的材料一同王作的同志對(duì)本研巧所做的任何貢獻(xiàn)均己在論文。與我中作了明確的說(shuō)明并表示了謝意。學(xué)位論文作者簽名;貸隹;^簽字曰期刻/方年3月曰7學(xué)位論文版權(quán)使用授權(quán)書(shū)本學(xué)位論文作者完全了解支達(dá)王業(yè)支堂_有關(guān)保留、使用學(xué)位論文的規(guī)定。特授權(quán)天津工業(yè)大學(xué)可W將學(xué)位論義的令部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)講行檢索,并采用影印、縮印或掃描等復(fù)制手段保存、匯編供查閱和借閱。同意學(xué)校向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和磁盤(pán)。(保密的學(xué)位論文在解
3、密后適用本授權(quán)說(shuō)明)學(xué)位論文作者簽名:導(dǎo)師簽名扭隹桃:巧呼簽字曰期部((年3月7曰簽字曰期:7〇《年5月曰(7學(xué)位論文的主要?jiǎng)?chuàng)新點(diǎn)一、通過(guò)對(duì)支持向量機(jī)的深入研究,發(fā)現(xiàn)支持向量機(jī)不能充分的利用樣本屬性;使用支持向量機(jī)進(jìn)行類別劃分時(shí)可認(rèn)為只利用了超平面法向量方向,但除該方向之外其他方向的屬性仍然有著或多或少的作用。二、提出了旋轉(zhuǎn)空間特征提取算法,利用支持向量機(jī)算法和旋轉(zhuǎn)矩陣對(duì)空間中樣本節(jié)點(diǎn)重復(fù)進(jìn)行旋轉(zhuǎn)和投影,W達(dá)到特征提取的目的。實(shí)驗(yàn)結(jié)果表明,本算法性能優(yōu)異,比目前主流的主成分分析算法提?。崳?/p>
4、的特征效果更好。摘要隨著大數(shù)據(jù)時(shí)代的到來(lái),龐大的數(shù)據(jù)量給人們帶來(lái)無(wú)限商機(jī),也引起了學(xué)術(shù)界、企業(yè)界及政府機(jī)構(gòu)的高度重視。但數(shù)據(jù)的復(fù)雜性和多樣性也導(dǎo)致數(shù)據(jù)價(jià)值密度不高,兀余數(shù)據(jù)較多等問(wèn)題。如何從龐大的數(shù)據(jù)集中提取有效信息^輔助數(shù)據(jù)!分析已成為數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域研究的焦點(diǎn)。一數(shù)據(jù)挖掘的個(gè)重要研究?jī)?nèi)容是特征選擇和持征提取。其中,主成分分析算法是一種常見(jiàn)的特征提取方法,它通過(guò)計(jì)算協(xié)方差達(dá)到特征提取的目的。支持向一一量機(jī)最初是種用于對(duì)數(shù)據(jù)進(jìn)行類別劃分和預(yù)測(cè)的機(jī)器學(xué)習(xí)算法,通過(guò)在個(gè)高一一一維空間中尋找個(gè)超平面,使
5、得分布于超平面同側(cè)的數(shù)據(jù)盡可能屬于同個(gè)類別。本文通過(guò)對(duì)支持向量機(jī)算法做深入研究后,發(fā)現(xiàn)支持向量機(jī)算法也可W被用一于特征提取,。借鑒主成分分析算法中的旋轉(zhuǎn)思想本文提出了種基于支持向量機(jī)、空間旋轉(zhuǎn)與坐標(biāo)投影的特征提取方法;然后用皮爾森相關(guān)系數(shù)驗(yàn)證單個(gè)特征的有效性;最后使用主流分類器驗(yàn)證所提取特征的有效性。實(shí)驗(yàn)結(jié)果表明,本算法在樣本集上提取到的前3個(gè)特征與分類標(biāo)簽均有顯著的相關(guān)性,而第3個(gè)レッ后的將征與類標(biāo)簽的相關(guān)性極弱。在不同分類器的分類結(jié)果中,當(dāng)使用經(jīng)旋轉(zhuǎn)空間特征提取算法處理后的特征時(shí),分類結(jié)果在77%的樣本
6、集上獲得了比當(dāng)使用PCA算法處理后的特征時(shí)更髙的預(yù)測(cè)正確率,在超過(guò)88%的樣本集上獲得了比直接使用源數(shù)據(jù)時(shí)更離的預(yù)測(cè)正確率;特別是當(dāng)使用樸素貝14葉斯算法時(shí),%在本算法處理后的特征上比直接在源數(shù)據(jù)上正確率高出近;當(dāng),1使用單層決策樹(shù)時(shí),在本算法處理后的特征上比在經(jīng)PCA處理后的特征上測(cè)正確率高出近10%。:關(guān)鍵詞支持向量機(jī);冗余數(shù)據(jù);大數(shù)據(jù);特征提取ABSTRACTWiththeadventoftheeraofbigdat:a,thehugeamountofdatabringsu
7、nHmikdn,busi打essopportu打ities,attractingtheacademic,idustryandgovemme打tagenciesreatatentionbutwithdataisbecominincreasinlcomlexanddiversesomeg,;ggypissuesaearlttt.toextractppikelowerdaadensiyandmoredaaredundancySohowusefulinformation
8、fromlargedatatofacilitatedataanalysisandcalculationsarebecomingmoreandmoreimortan