資源描述:
《基于樣本遷移的多核學(xué)習(xí)算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中山大學(xué)碩士學(xué)位論文基于樣本遷移的多核學(xué)習(xí)算法研究姓名:黃育釗申請學(xué)位級別:碩士專業(yè):軟件工程指導(dǎo)教師:任江濤20100603中山大學(xué)碩士研究生論文基予樣本遷移的多核學(xué)習(xí)算法研究論文題目:基于樣本遷移的多核學(xué)習(xí)算法研究專業(yè):軟件工程碩士生:黃育釗指導(dǎo)老師:任江濤摘要隨著遷移學(xué)習(xí)與核方法在機器學(xué)習(xí)領(lǐng)域的廣泛應(yīng)用,其受到了研究人員越來越多的關(guān)注。隨著核方法在機器學(xué)習(xí)中的引入并廣泛的應(yīng)用,其在線性和非線性間架設(shè)了一座橋梁;其次通過巧妙的引入核函數(shù),避免了維數(shù)災(zāi)難,也避免增加計算復(fù)雜度。Lanckriet等人提出多核學(xué)習(xí)方法,其認為核函數(shù)可以表示為多個基礎(chǔ)核函數(shù)的加權(quán)和。多核學(xué)習(xí)算法因
2、其具有更強的解析性,可以表示更為靈活的模型,由此多核學(xué)習(xí)在基因序列表示、圖像識別等領(lǐng)域受到了越來越多的應(yīng)用。如果當前的學(xué)習(xí)任務(wù)所掌握的訓(xùn)練樣本非常有限時,傳統(tǒng)的機器學(xué)習(xí)算法往往不能夠訓(xùn)練一個足夠好的模型。對此,遷移學(xué)習(xí)提出借用相關(guān)任務(wù)的知識來提高當前學(xué)習(xí)任務(wù)的性能。按照遷移的方法劃分,遷移學(xué)習(xí)可以劃分成四類:基于實例的遷移、特征表示遷移、參數(shù)遷移以及相關(guān)知識遷移。其中本文提出了兩個基于樣本遷移學(xué)習(xí)的多核學(xué)習(xí)方法,組合多核遷移學(xué)習(xí)算法(砸M慰丁)和遞增多核遷移學(xué)習(xí)算法(七,MK乙丁)。本文所提出的樣本遷移學(xué)習(xí)算法屬于基于實例的遷移學(xué)習(xí)分類,算法基于如下的假設(shè):在原特征空間上分布不
3、同的源領(lǐng)域數(shù)據(jù)與目標領(lǐng)域數(shù)據(jù),經(jīng)過核函數(shù)映射到高維特征空間,除了使得在原特征空間中線性不可分的點變得線性可分之外,在原特征空間中,源領(lǐng)域數(shù)據(jù)與目標領(lǐng)域數(shù)據(jù)不相鄰的數(shù)據(jù)在高維特征空間中可能會變得相當?shù)慕咏?。那么通過將這些比較接近目標領(lǐng)域數(shù)據(jù)的源領(lǐng)域數(shù)據(jù)“借”給目標任務(wù)進行機器學(xué)習(xí)訓(xùn)練,其性能會得到進一步的提升。本文所提出算法可分為四個步驟,核學(xué)習(xí)步驟、映射步驟、知識遷移步驟和迭代步驟。其中在核學(xué)習(xí)步驟的主要任務(wù)為針對樣本學(xué)習(xí)一個足夠好的多核表示。映射步驟把源及目標領(lǐng)域中的樣本映射到前一步驟所學(xué)習(xí)的高維特征空間中山大學(xué)碩士研究生論文基于樣本遷移的多核學(xué)習(xí)算法研究中。在知識遷移步驟中
4、則在源領(lǐng)域中尋找最適合的數(shù)據(jù)點加入目標領(lǐng)域?qū)W習(xí)任務(wù)的訓(xùn)練集。最后在迭代步驟中根據(jù)需要對前三個步驟進行迭代。為了說明本文所提出算法的有效性,所提出兩個算法在8個UCI數(shù)據(jù)集上的實驗結(jié)果與隨機采樣算法、多核學(xué)習(xí)算法、SMO、NaiveBayes及IBK算法做比較,實驗結(jié)果說明本文所提出的算法可以有效的提高當前學(xué)習(xí)任務(wù)的性能。為了說明所提出算法對參數(shù)的敏感性,本文還對提出的兩個算法的敏感性進行分析,從實驗結(jié)果得知算法是一種可行的遷移學(xué)習(xí)方法。關(guān)鍵字:機器學(xué)習(xí)、遷移學(xué)習(xí)、多核學(xué)習(xí)、支持向量機中山大學(xué)碩十研究生論文基于樣本遷移的多核學(xué)習(xí)算法研究Title:Instance-basedTr
5、ansferMultipleKernelLearningAlgorithmMajor:SoftwareEngineeringName:YuzhaoHuangSupervisor:AssociateProf.JiangtaoRenAbstractAsmoreandmoreapplicationsoftransferlearningandkernelmethod,researcherspaymoreattemiontOthosefields.TheKernelmethodgivesthealgorithmtheabilitytoprocesslinearandnon-lineard
6、ata.Thekernelalgorithmbringinthekernelfunctions虹ll如lly,itavoidthecurseofdimensionandcomputationcomplexity.Lanckrieteta1.proposetheMukipleKernelsLearningmethodin2006;theyformulizethekernelfunctionastheweightedsumofsomebasickernelfunctions.Becauseweareinterestedinmoreflexiblemodelsmostofthetim
7、eandtheMultipleKernelsLearningalgorithmcanenhancetheinterpretabilityofthedecisionfunctionandimproveperformancesthanthesingleone,therearemoreandmoreapplicationsofMultipleKernelsLearninginbioinformationandimagerecognition.Ifthecurrentlearningtaskhasl