資源描述:
《基于鏈接分析和聚類的標簽語義分析方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文基于鏈接分析和聚類的標簽語義分析方法研究ResearchonSemanticAnalysisofTagsbasedonLinkAnalysisandClusteringMethods學(xué)號:21Q!ZQ!Z大連理工大學(xué)DalianUniversityofTechnology大連理工大學(xué)學(xué)位論文獨創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請學(xué)位或其
2、他用途使用過的成果。與我一同工作的同志對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。若有不實之處,本人愿意承擔相關(guān)法律責(zé)任。學(xué)位論文題目:基王筵蕉坌塹塑塞耋數(shù)拯筌適豎坌塹友洼盟窺作者簽名:監(jiān)垡吣日期:蘭!二年—乙月三一日大連理工大學(xué)碩士學(xué)位論文摘要社會標注系統(tǒng)的快速發(fā)展為互聯(lián)網(wǎng)信息組織提供了新的方式。它延續(xù)了Web2.0以用戶為中心的特點,充分利用用戶知識來進行數(shù)據(jù)維護和管理。目前,越來越多的系統(tǒng)提供了對社會標注的支持。無論從支持的形式的多樣性,還是從提供的功能的強健性上來說,社會標注系統(tǒng)的不斷
3、完善為廣大互聯(lián)網(wǎng)用戶提供了更為方便的信息組織、分享以及查詢環(huán)境。在社會標注系統(tǒng)中,用戶可以不受約束的通過標簽來對自己關(guān)注的資源進行標注。標簽是社會標注中最為突出的特色,它不但顯式地對資源內(nèi)容進行語義描述,還隱式地反映著用戶的興趣偏好。其自由使用的特點讓用戶以沒有任何限制的方式來對自己感興趣的內(nèi)容進行管理,因此無論什么背景的用戶都可以參與到大眾分類法的構(gòu)建當中。然而,如同一把雙刃劍,標簽的自由性也為社會標注分析帶來了很大的困難。首先,標簽的歧義性問題嚴重阻礙了系統(tǒng)中推薦、分類、檢索等功能的準確性。再次,數(shù)據(jù)空
4、間過大的問題為進行快速、精準數(shù)據(jù)分析帶來了很大的障礙。通常而言,標簽在社會標注系統(tǒng)中以單詞或詞組的形式獨立存在,但是不同的標簽會共同標注相同資源或被不同用戶同時使用,這樣就提供一種發(fā)現(xiàn)標簽之間間接關(guān)聯(lián)的方式。因此,本文就從這些關(guān)系入手進行分析來解決社會標注分析過程中由標簽所引起的一些難題。本文首先對社會標注系統(tǒng)中的基本概念進行介紹,講解當前系統(tǒng)建模方式、系統(tǒng)應(yīng)用特點以及社會標注分析過程中的一些難題等。然后,針對存在的問題提出基于連接分析和聚類的兩類算法。在基于連接分析算法中,本文對用戶以及標注行為進行打分,
5、以尋求系統(tǒng)中權(quán)威用戶和權(quán)威標注行為;在聚類算法中,本文首先對基于主題建模方案進行闡述,然后針對社會標注系統(tǒng)的特點提出基于潛在主題的標簽聚類方式。在文章后半部分,通過在實際數(shù)據(jù)集Delicious和Movielens上進行了大量的實驗分析,證實了問題提出的兩個算法的合理性和有效性。關(guān)鍵詞:社會標注系統(tǒng);大眾分類法;標簽歧義性;標簽空間;連接分析;聚類基于鏈接分析和聚類的標簽語義分析方法研究ResearchonSemanticAnalysisofTagsbasedonLinkAnalysisandCluster
6、ingMethodsAbstractThedevelopmentofsocialtaggingsystemprovidesanovelwaytoorganizetheinformationontheInternet.Inheritingthecharacteristiesthattreatingtheusersasthecore,socialtaggingsystemsmakefullyuseoftheknowledgeandexpertiseoftheordinaryusers·Currently,all
7、increasingnumberofinformationsystemssupportthefunctionsofsocialtagging.Frombothperspectivesofthediversityofsupportedresourceandtheroughnessofprovidedfunctions,thecontinuallyimprovingofsocialtaggingsystemserverstheIntemetusersamoreconvenientwaytomanage,shar
8、eandretrievetheinformation.Withinthesocialtaggingsystem,userscanannotatethecaredresourceswithtagsinanunrestrictedway.Asthemostsignificantcharacterofthesocialtagging,tagsaretheexplicitsemanticdescriptorsofthec