資源描述:
《社會標(biāo)注語義研究開題報告及綜述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、本科生畢業(yè)論文(設(shè)計)開題報告課題名稱社會標(biāo)注系統(tǒng)中基于語義的信息檢索研究院系名稱信息管理學(xué)院專業(yè)名稱信息管理與信息系統(tǒng)學(xué)生姓名指導(dǎo)教師(內(nèi)容包括:課題的意義,岡內(nèi)外研究動態(tài),木課題的研究內(nèi)容、研究方法、研究手段和研究步驟以及參考書目等)。一、課題意義隨著web2.0的誕生,信息網(wǎng)絡(luò)技術(shù)飛速發(fā)展,M絡(luò)用戶可以方便的實吋的進行上傳,瀏覽,下載,推薦,共享,收藏,標(biāo)記各類信息,同時也可以對自己覺得有價值的信息和數(shù)據(jù)加標(biāo)簽或者發(fā)表評論(paul,2007)。由丁?現(xiàn)今眾多大眾傳播媒體M站支持M絡(luò)用戶的這種操作,用戶擺脫了原來被動接受
2、的角色變成積極主動的參與者(陳潔,2008)。信息交流真正實現(xiàn)了全網(wǎng)民參與。社會標(biāo)簽在網(wǎng)絡(luò)中的應(yīng)用越來越廣泛,它為信息資源的標(biāo)引、組織索引提供了一種全新的摸式。社會標(biāo)注系統(tǒng)屮基于語義的信息檢索研究主要意義在于規(guī)范化社會化標(biāo)注的表達,去除標(biāo)簽噪聲及垃圾,使標(biāo)簽序化層級化。最終使檢索更方便快捷,提高信息的檢準(zhǔn)率,降低信息的管理成本。本課題致力于基丁?現(xiàn)冇社會標(biāo)注系統(tǒng)的信息檢索的方式和方法,分析存在的問題及不足,提出基于語義的社會標(biāo)注系統(tǒng)檢索優(yōu)化模型。二、國內(nèi)外研究動態(tài)1.國研究現(xiàn)狀:社會化標(biāo)注系統(tǒng)屮標(biāo)簽的語義模糊性和形式不規(guī)范使得
3、資源管理與共事越來困難,為準(zhǔn)確定位標(biāo)簽語義,提高社會標(biāo)注系統(tǒng)中基于語義的信息檢索效能。本領(lǐng)域?qū)W者宣云干[11從擴展標(biāo)簽語義與涌現(xiàn)標(biāo)簽語義兩個方面,分析了社會化標(biāo)注系統(tǒng)中標(biāo)簽語義檢索的研究不足,并總結(jié)得出可計算性高、可操作性強、能智能獲取標(biāo)簽的語義關(guān)系是社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索的未來研究方向。在分析社會化標(biāo)注系統(tǒng)基于語義檢索研究現(xiàn)狀基礎(chǔ)上,針對傳統(tǒng)方法可計算性不高、完備性不夠、無法分辨自然語言的語義模糊性等不足,提出基于潛在語義分析的社會化標(biāo)注系統(tǒng)語義檢索模型,改進標(biāo)簽-資源矩陣權(quán)重計算算法,完善社會化標(biāo)注系統(tǒng)的語義標(biāo)注方法.
4、并以delicious系統(tǒng)為例抓取數(shù)據(jù)進行驗證分析,通過對比,證明提出的模型和改進的算法能顯著提高社會標(biāo)注系統(tǒng)基于語義的檢索效率.社會標(biāo)注系統(tǒng)屮基于語義的信息檢索研究對企業(yè)和社會對于巨額信息的管理有著極其重要的意義
5、21,國內(nèi)學(xué)者余春131在該領(lǐng)域的研究中指出基于社會標(biāo)注的系統(tǒng)語義檢索方式將與傳統(tǒng)的以受控詞表為基礎(chǔ)的檢索方式并存,各自適用丁?不同的信息環(huán)境:非正式和正式的。何繼媛141還建立了社會標(biāo)注系統(tǒng)中基于語義的信息檢索模型。模型主要乜含7個了模塊:資源標(biāo)注模塊、標(biāo)簽推薦模塊、提問處理模塊、語義檢索模塊、結(jié)果處理模塊、用戶
6、反饋處理模塊以及本體構(gòu)建和管理模塊,并詳細地闡述了檢索過程和模型屮各個模塊的功能和實現(xiàn)方法。1.國外研究現(xiàn)狀:Mcdonncll151等人探討了在網(wǎng)絡(luò)搜索中社會標(biāo)注這一“集體智S”的價值與力量,提出了“社會化搜索”的新概念及其分類體系。Morrison通過研究發(fā)現(xiàn)用社會標(biāo)注體系標(biāo)簽進行檢索的效果令人驚訝,如果能更好運用可以提高它的檢索性能。社會標(biāo)注是用戶對信息資源內(nèi)容、形式等的描述、概拈,帶有很強的語義性,用戶可以從社會標(biāo)注屮挖掘出語義信息,利用它理解內(nèi)容的語義,實現(xiàn)更高效的檢索。(二)基本研究思路A研究目的和意義基于現(xiàn)奮社會
7、標(biāo)注系統(tǒng)的信息檢索的方式和方法,分析存在的問題及不足,提出基于語義的社會標(biāo)注系統(tǒng)檢索優(yōu)化模型。其意義在于為提高社會標(biāo)注系統(tǒng)中的信息檢索效率提供新途徑,宥利于改善用戶體驗,使更多的網(wǎng)絡(luò)用戶參與到網(wǎng)絡(luò)信息資源的創(chuàng)建與組織工作屮,充分實現(xiàn)倍息資源的傳播與共享,最大限度地發(fā)揮信息資源的價值。B主要研究內(nèi)容(1)現(xiàn)有社會標(biāo)注系統(tǒng)的檢索方法分析及特點分析考察宥代表性的社會標(biāo)簽網(wǎng)站(中文的如豆瓣、豆丁,英文的如Delicous、CiteUlke等)這些網(wǎng)站都提供什么樣的檢索方式,是基于關(guān)鍵同匹配的簡單檢索、可以限定檢索字段的高級檢索,有沒有
8、同義擴展、上下位擴展和基于關(guān)聯(lián)關(guān)系等的智能化檢索功能。如果有,是基于什么樣的詞表或原理實現(xiàn)擴展的?檢索效率如何(利用檢索全率和檢準(zhǔn)率來分析檢驗檢索效率)通過上述分析總結(jié)社會標(biāo)注系統(tǒng)中的檢索再宥什么優(yōu)點(因為有優(yōu)點,才吸引網(wǎng)絡(luò)用戶參與到網(wǎng)絡(luò)信息資源的生產(chǎn)、組織與共享屮,愿意通過標(biāo)簽實現(xiàn)對網(wǎng)絡(luò)信息資源的標(biāo)注),存在哪些不足(不足之處的存在,正我們需要改進的地方)。(2)社會標(biāo)注系統(tǒng)屮基于標(biāo)簽語義的檢索方法設(shè)計針對現(xiàn)冇社會標(biāo)注系統(tǒng)中存在的不足,提出改善用戶體驗、提高檢索效率,讓用戶的資源讓更多其它用戶發(fā)現(xiàn)和利用。具體包括:①針對用戶
9、對資源標(biāo)注的問題,可采用以下幾個方而對標(biāo)簽的質(zhì)量進行控制:a)對用戶標(biāo)注標(biāo)簽的規(guī)范化(采用系統(tǒng)引導(dǎo)和簡單審核機制,避免用戶輸入拼寫錯誤和一些無意義的、不規(guī)范的標(biāo)簽)b)基于系統(tǒng)中的已冇標(biāo)簽,通過標(biāo)簽的頻率、標(biāo)簽之間的關(guān)聯(lián)等特征h'd用戶推薦適合的標(biāo)簽。②針對基于標(biāo)簽的檢索問題