資源描述:
《基于關(guān)聯(lián)性挖掘的流形對(duì)齊算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、學(xué)校代碼:10385分類號(hào):研究生學(xué)號(hào):1300404003密級(jí):基于關(guān)聯(lián)性挖掘的流形對(duì)齊算法研究ResearchonManifoldAlignmentalgorithmsbasedonthediscoveringofthecorrelations作者姓名:徐猛指導(dǎo)教師:王靖合作教師:學(xué)科:計(jì)算機(jī)科學(xué)與技術(shù)研究方向:流形對(duì)齊所在學(xué)院:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院論文提交日期:2016年6月1日摘要摘要在一些領(lǐng)域的學(xué)習(xí)中,如模式識(shí)別,它們所需要的數(shù)據(jù)如圖像數(shù)據(jù)都是存儲(chǔ)在高維空間中,而且數(shù)據(jù)結(jié)構(gòu)比較的復(fù)雜,同時(shí)可視化程度相對(duì)的不太
2、好。多年以來(lái),流形學(xué)習(xí)和其算法在數(shù)據(jù)可視化方面和數(shù)據(jù)降維的領(lǐng)域取得了較大成功,慢慢變?yōu)樵擃I(lǐng)域熱點(diǎn)問(wèn)題。盡管這些算法得到了非常廣的應(yīng)用,但是只能對(duì)單個(gè)的流形數(shù)據(jù)進(jìn)行降維。在現(xiàn)實(shí)世界的許多應(yīng)用中,如跨語(yǔ)言信息檢索、圖像和文本的匹配、姿態(tài)估計(jì)等都需要處理兩個(gè)或則更多的數(shù)據(jù)集。很多年以來(lái),學(xué)者們?yōu)榱颂幚磉@個(gè)問(wèn)題經(jīng)過(guò)努力提出了流形對(duì)齊算法。流形對(duì)齊可以將來(lái)自不同的流形數(shù)據(jù)映射到一個(gè)共同的低維空間,并保持每個(gè)流形的局部幾何結(jié)構(gòu)不變,同時(shí)匹配不同數(shù)據(jù)集樣本之間的對(duì)應(yīng)關(guān)系。在流形對(duì)齊算法中,流形樣本點(diǎn)之間的關(guān)聯(lián)性挖掘是流形對(duì)齊的關(guān)鍵步
3、驟。因此,本文在圍繞如何更準(zhǔn)確挖掘不同流形樣本點(diǎn)之間關(guān)聯(lián)性的問(wèn)題,提出新的流形對(duì)齊算法。簡(jiǎn)單來(lái)說(shuō),本文有下面工作:1.在針對(duì)無(wú)法獲取對(duì)應(yīng)信息的無(wú)監(jiān)督情形,本文提出一個(gè)基本的假設(shè):對(duì)于兩個(gè)流形或則更多流形上關(guān)聯(lián)性較強(qiáng)的樣本點(diǎn),其鄰域點(diǎn)之間也會(huì)具有較強(qiáng)的關(guān)聯(lián)性?;诖思僭O(shè),我們提出一種新的非監(jiān)督流形對(duì)齊算法,通過(guò)學(xué)習(xí)局部鄰域之間的關(guān)聯(lián)性以挖掘不同流形樣本點(diǎn)間的關(guān)聯(lián)性,再將兩個(gè)或則多個(gè)流形樣本點(diǎn)投影到共同的低維空間,同時(shí)保持所挖掘的關(guān)聯(lián)性。2.在半監(jiān)督算法中,需要事先給出部分已知對(duì)應(yīng)信息點(diǎn),但是當(dāng)給定對(duì)應(yīng)點(diǎn)信息不充分時(shí),單一
4、的利用局部結(jié)構(gòu)或全局結(jié)構(gòu)都無(wú)法準(zhǔn)確的挖掘不同流形樣本點(diǎn)之間的關(guān)聯(lián)性。因此本文提出了一種新的算法思路,首先構(gòu)造流形樣本點(diǎn)之間的初始化關(guān)聯(lián)性,然后用樣本點(diǎn)之間的局部結(jié)構(gòu)相似性對(duì)初始化關(guān)聯(lián)性進(jìn)行修正,這樣更為準(zhǔn)確的發(fā)掘流形樣本點(diǎn)之間的關(guān)聯(lián)性。進(jìn)一步的,提出一種新的半監(jiān)督流形對(duì)齊算法,利用已知信息點(diǎn)和所挖掘的樣本點(diǎn)關(guān)聯(lián)性,將多個(gè)流形樣本點(diǎn)投影到共同的低維空間。3.最大方差展開(kāi)(MaximumVarianceUnfolding,MVU)是一種比較經(jīng)典的流形學(xué)習(xí)方法,主要目的是把單一流形展開(kāi)有效的獲取流形數(shù)據(jù)的低維坐標(biāo)。將MVU的
5、思想進(jìn)一步擴(kuò)廣,我們提出了基于最大方差展開(kāi)的流形對(duì)齊算法。我們I摘要目的是構(gòu)造半定規(guī)劃(semi-definiteprogramming,SDP)模型,首先是保證流形中每個(gè)樣本點(diǎn)的近鄰點(diǎn)的距離不變,以此保證穩(wěn)定性。然后再用給出的對(duì)應(yīng)信息點(diǎn)之間的關(guān)聯(lián)性為約束,對(duì)此進(jìn)行建模,構(gòu)造一個(gè)目標(biāo)函數(shù)來(lái)求解問(wèn)題。最后求解此SDP模型,獲取多個(gè)數(shù)據(jù)集的低維坐標(biāo)。最后通過(guò)在多個(gè)實(shí)際數(shù)據(jù)集上驗(yàn)證我們上面提出的三種算法有效性。關(guān)鍵詞:流形學(xué)習(xí)流形對(duì)齊半監(jiān)督非監(jiān)督關(guān)聯(lián)性IIAbstractAbstractInmachinelearningan
6、dpatternrecognition,theacquisition,storage,andtheneeddealwithdataisoftenexistinhigh-dimensionalspace,suchashighresolutionimagedata,video,audio,etc.Inrecentyears,themanifoldlearningandalgorithmhasachievedgreatsuccessandbecomeoneofresearchhotspots.Althoughthemanif
7、oldlearningalgorithmiswidelyused,theycanonlydealwithasinglemanifold.Intherealworldofmanyapplications,suchas,cross-languageinformationretrieval,imageandtextofmatchingandposeestimation,etc,neededdealwithtwoormoredatasets.Inordertosolvethisproblem,scholarshavepropo
8、sedmanifoldalignmentalgorithmwhichcandealwithfromdifferentdatasetsmappedtoacommonlowdimensionalspace,andthelocalgeometricalstructureofeachdatasetunchanged,simultaneou