資源描述:
《基于實(shí)例的遷移學(xué)習(xí)算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、學(xué)校代碼10125專業(yè)代碼120100山西財經(jīng)大學(xué)碩士學(xué)位論文題目基于實(shí)例的遷移學(xué)習(xí)算法研究姓名呂靜專業(yè)管理科學(xué)與工程研究方向管理信息系統(tǒng)指導(dǎo)教師李愛軍2013年3月6日`UniversityCode10125MajorCode120100ShanxiUniversityofFinance&EconomicsThesisforMaster’sDegreeTitleResearchofTransferLearningAlgorithmbasedonInstanceNameLvJingMajorManagemen
2、tScienceandEngineeringResearchOrientationManagementInformationSystemTutorLiAijunMar6,2013山西財經(jīng)大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究所做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本申明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:年月
3、日1山西財經(jīng)大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保管、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)山西財經(jīng)大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于保密□,不保密□。在年解密后適用本授權(quán)書。(請在以上方框內(nèi)打“√”)學(xué)位論文作者簽名:指導(dǎo)教師簽名:日期:年月日日期:年月日2摘要傳統(tǒng)的機(jī)器學(xué)習(xí)中當(dāng)分布發(fā)生變換時,大部分的機(jī)器學(xué)習(xí)方法不具備自
4、適應(yīng)能力,需要重新學(xué)習(xí),要求用戶收集更多的訓(xùn)練數(shù)據(jù)。在現(xiàn)實(shí)的應(yīng)用中,重新收集訓(xùn)練數(shù)據(jù)、重新訓(xùn)練學(xué)習(xí)機(jī)代價很大,非常有必要減少這些環(huán)節(jié),遷移學(xué)習(xí)的研究就成為一種必然。遷移學(xué)習(xí)可以應(yīng)用相關(guān)領(lǐng)域的數(shù)據(jù),將相關(guān)領(lǐng)域的有用知識"遷移"到目標(biāo)領(lǐng)域中,用以解決在目標(biāo)領(lǐng)域的學(xué)習(xí)任務(wù).而遷移學(xué)習(xí)的關(guān)鍵是如何選取相關(guān)數(shù)據(jù)以幫助目標(biāo)領(lǐng)域的學(xué)習(xí)。本文提出一種基于聚類集成的遷移學(xué)習(xí)算法,通過從源數(shù)據(jù)中尋找能夠幫助目標(biāo)數(shù)據(jù)學(xué)習(xí)的實(shí)例以幫助目標(biāo)領(lǐng)域的學(xué)習(xí),并且針對基于聚類集成遷移學(xué)習(xí)目標(biāo)數(shù)據(jù)較少,容易過度擬合的缺陷,提出了基于半監(jiān)督的聚類
5、集成遷移學(xué)習(xí)算法以改進(jìn)該缺陷。最后對兩個算法在20個新聞組數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),證明這兩個算法能有效提高目標(biāo)數(shù)據(jù)的學(xué)習(xí)效率?!娟P(guān)鍵詞】遷移學(xué)習(xí)聚類集成半監(jiān)督AbstractWhenthedistributionischangedinthetraditionalmachinelearning,mostofmachinelearningmethodisnothaveadaptiveability,theyneedtorelearn,itrequirestheusertocollectmoretrainingdata
6、.Inrealapplications,re-collecttrainingdataandre-trainingthelearningmachinearecostly.Itisnecessarytoreducethispartofre-learning,researchoftransferlearninghasbecomeinevitable.Transferlearningcanbeappliedtorelateddata.Wetransferusefulknowledgeofrelatedfieldsto
7、thetargetfieldtosolvethelearningtaskinthetargetfield.Whileinthetransferlearninghowtoselecttherelateddatatohelptargetdatalearningisthekeytotransferlearning.Thispaperproposesatransferlearningalgorithmbasedonclusteringensembletofindinstancewhichcanhelptargetda
8、tastudyfromthesecondarydatatohelptargetareasoflearning.Andforthedefectoftransferlearningalgorithmbasedonclusteringensembleisthattargetdataislessandeasytooverfitting,presentedonaclusteringensembletransf