資源描述:
《數(shù)據(jù)維數(shù)約簡及分類算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、’'?;'’式,-*;";/瓜/,品巧礦獻(xiàn)..',.、.、:p’A:^,、吟,時‘..、.,、.-.Vt.級分類號知.密.、'f見古‘.10154UDC\單位代碼、.*AI!;X.’.,-‘‘礦.',.I:-V‘矣、-戶f;;濟氣‘'工業(yè)大學(xué)文il寧<:>^^碩±學(xué)位論文寒馬婦^"..,,.I-數(shù)據(jù)維數(shù)約簡及分類算法研究''■K:、/-'若U';f專業(yè):通信與信息系統(tǒng)'研究生:周勇、.、,ay.I—指導(dǎo)教師:蔡希朦副教授^,/';、;、
2、興.';、V■;、嘴'VU.一/'—'、:?\.‘....、、,.:;K:、‘;’’,’:、^.、I./李Win--、、-‘W./-、、-\‘,,—j’‘''-.護'’V冷.to.;;.六隹月;;.基.別'..?一^?‘5、,'1'己..?-..>n,/、;-...、4.',AWJ、.、—.’'‘滬爲(wèi)^藏%—獨創(chuàng)性聲明本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加yA標(biāo)注和致謝的地方外,論文中,不包含
3、其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得遷寧王業(yè)大學(xué)或其他教育機構(gòu)的學(xué)位或證書而使用過的材料一同工作的同志對本研究所作的任。與我何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。研究生簽名:年月^曰5爭關(guān)于論文使用授權(quán)的說明本人完全了解遷寧工業(yè)大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,目P:學(xué)校有權(quán)保留送交的復(fù)印權(quán),允許論文被查閱和借閱學(xué)??桑坠颊撐牡娜炕虿浚崳姡环謨?nèi)容,可W采用影印、縮印或其他復(fù)制手段保存論文。(保密的論文在解密后應(yīng)遵守此規(guī)定)研究生簽名:導(dǎo)師簽名;黎餐?。崳姡荆薄赌??月方曰IMasterThesisDataDimensio
4、nalityReductionandClassificationAlgorithmsSpeciality:CommunicationandInformationSystemsCandidate:ZHOUYongSupervisor:AssociateProfessorCAIXi-biaoLiaoningUniversityofTechnologyJinzhou,121001,ChinaMarch2016摘要遼寧工業(yè)大學(xué)碩士學(xué)位論文摘要隨著信息技術(shù)的發(fā)展,涌現(xiàn)出海量數(shù)據(jù),推動了機器學(xué)習(xí)理論不斷地向前發(fā)展。樣本數(shù)據(jù)維數(shù)越高,數(shù)據(jù)存儲越困難,同時數(shù)據(jù)的計算量也越大;此外,數(shù)據(jù)中還存在著噪聲或
5、者冗余特征。因此,如何降低高維數(shù)據(jù)的維數(shù),避免“維數(shù)災(zāi)難”問題,提高數(shù)據(jù)的分類精度,已經(jīng)成為機器學(xué)習(xí)領(lǐng)域關(guān)注的一個熱點問題。非負(fù)矩陣分解作為一種矩陣分解算法,約束待分解矩陣中和因式分解獲得的矩陣中所有的元素為非負(fù)。這種非負(fù)性約束具有明確的物理意義,使得非負(fù)矩陣分解作為一種維數(shù)約簡算法得到了廣泛關(guān)注。同時,半監(jiān)督學(xué)習(xí)(semi-supervisedlearning)由于能夠同時利用少量的已知標(biāo)記樣本和大量未標(biāo)記樣本數(shù)據(jù)進行有效的學(xué)習(xí),大大克服了有監(jiān)督學(xué)習(xí)算法中樣本數(shù)量不足問題,提高了分類的精度,因而半監(jiān)督學(xué)習(xí)方法在圖像分類、文本分類及郵件分類等問題中得到了普遍的運用。論文集成基于非負(fù)矩陣
6、分解的維數(shù)約簡算法和基于半監(jiān)督學(xué)習(xí)的分類算法,首先提出了一種基于非負(fù)矩陣分解與一致性學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法。然后,在非負(fù)矩陣分解過程中引入類別信息,提出了一種基于約束非負(fù)矩陣分解與一致性學(xué)習(xí)的半監(jiān)督分類算法。該算法在降維過程中引入少量已知標(biāo)簽類別信息作為約束條件,增強數(shù)據(jù)降維后的特征表示能力。最后,引入類別之間的依賴性,提出了一種基于構(gòu)建類別圖的維數(shù)約減的半監(jiān)督學(xué)習(xí)算法。該算法分別在樣本與樣本之間、類與類之間創(chuàng)建圖,構(gòu)建基于圖的正則化框架,再通過求解Sylvester方程得到未標(biāo)記樣本的標(biāo)簽。在公開數(shù)據(jù)集上的實驗結(jié)果表明,論文算法在充分利用少量已知標(biāo)簽的同時用于數(shù)據(jù)的維數(shù)約簡,不僅能有效
7、地降低了數(shù)據(jù)的維度,還能夠有效地提高分類器的泛化能力。關(guān)鍵詞:機器學(xué)習(xí);維數(shù)災(zāi)難;維數(shù)約簡;半監(jiān)督學(xué)習(xí);Sylvester方程IAbstract遼寧工業(yè)大學(xué)碩士學(xué)位論文AbstractWiththedevelopmentofinformationtechnology,hugeamountsofdatahaveconstantlysprungup,whichpushesforwardthetheoryofmachinelearning.Thehi