基于本體的語(yǔ)義檢索技術(shù)研究

基于本體的語(yǔ)義檢索技術(shù)研究

ID:32741229

大小:3.49 MB

頁(yè)數(shù):50頁(yè)

時(shí)間:2019-02-15

基于本體的語(yǔ)義檢索技術(shù)研究_第1頁(yè)
基于本體的語(yǔ)義檢索技術(shù)研究_第2頁(yè)
基于本體的語(yǔ)義檢索技術(shù)研究_第3頁(yè)
基于本體的語(yǔ)義檢索技術(shù)研究_第4頁(yè)
基于本體的語(yǔ)義檢索技術(shù)研究_第5頁(yè)
資源描述:

《基于本體的語(yǔ)義檢索技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、第1章緒論究15J,他們目前從事的研究重點(diǎn)是構(gòu)建基于本體的知識(shí)門戶和語(yǔ)義門戶。美國(guó)斯坦福大學(xué)的知識(shí)系統(tǒng)實(shí)驗(yàn)室,無(wú)論是在本體建模工具領(lǐng)域,還是在本體應(yīng)用層面的研究方面,都站在了知識(shí)工程領(lǐng)域的最前沿。除此之外,國(guó)外研究基于本體檢索加工的學(xué)者和機(jī)構(gòu)還有西班牙薩拉戈薩大學(xué)的Eduardo和巴斯克大學(xué)的Arantza,以及美國(guó)佐治亞大學(xué)大規(guī)模分布式信息系統(tǒng)實(shí)驗(yàn)室【6】和美國(guó)德克薩斯大學(xué)計(jì)算機(jī)系的基于知識(shí)系統(tǒng)研究小組等。國(guó)內(nèi)對(duì)本體的研究起步比較晚,主要研究?jī)?nèi)容包括產(chǎn)品信息建模、虛擬企業(yè)建?!?1、常識(shí)知識(shí)庫(kù)[81等。徐振寧

2、【9-111等人把本體作為信息檢索系統(tǒng)的核心,通過(guò)構(gòu)造形式化的領(lǐng)域本體,提出了一種將知識(shí)表示和知識(shí)處理引入互聯(lián)網(wǎng)信息處理的方法,為互聯(lián)網(wǎng)上半結(jié)構(gòu)化數(shù)據(jù)和關(guān)系數(shù)據(jù)庫(kù)提供了統(tǒng)一的語(yǔ)義模型。中科院計(jì)算所智能信息處理開(kāi)放研究室建立的基于本體論和多主體的信息檢索服務(wù)器【121利用了多智能主體和本體理論設(shè)計(jì)。宋峻峰【13】提出的基于本體的信息檢索模型采用了描述邏輯作為構(gòu)造本體的本體語(yǔ)言,使用本體中定義的詞匯來(lái)標(biāo)記文檔,生成基于本體的文檔邏輯視圖和用戶信息需求邏輯視圖,從而可以實(shí)現(xiàn)語(yǔ)義層次的檢索,使檢索性能大大改善。浙江大學(xué)

3、人工智能研究所對(duì)基于本體的產(chǎn)品信息進(jìn)行了深入研究【H】。重慶大學(xué)的張英?!?5】等在基于關(guān)鍵詞和概念分析的基礎(chǔ)上,提出了一種基于語(yǔ)義概念模型檢索的向量空間模型。臺(tái)灣的蕖俊儒在基于模糊邏輯的基礎(chǔ)上,提出了模糊本體的概念,并給出了模糊本體自動(dòng)生成框架,用于處理文檔中存在的不確定信息。1.3課題的主要研究?jī)?nèi)容在綜合分析當(dāng)前本體國(guó)內(nèi)外研究現(xiàn)狀,信息檢索系統(tǒng)存在問(wèn)題以及本體技術(shù)的基礎(chǔ)上,本課題以研究本體的理論和技術(shù)為基礎(chǔ),研究如何在領(lǐng)域本體的基礎(chǔ)上提高信息檢索查詢質(zhì)量,并針對(duì)現(xiàn)有的非結(jié)構(gòu)化或半結(jié)構(gòu)化的信息,在基于傳統(tǒng)的信

4、息檢索系統(tǒng)結(jié)構(gòu)的基礎(chǔ)上,本文提出了一個(gè)基于模糊本體的語(yǔ)義檢索向量空間模型,詳細(xì)闡述了基于模糊本體的語(yǔ)義索引、文檔預(yù)處理和查詢擴(kuò)展等。詳細(xì)研究了概念檢索中的關(guān)鍵部分一概念映射技術(shù),并實(shí)現(xiàn)了基于本體的信息檢索系統(tǒng)。1.4論文創(chuàng)新點(diǎn)課題研究中本人的主要工作和創(chuàng)新點(diǎn)如下:(1)課題將數(shù)據(jù)流挖掘技術(shù)引入到智能檢索領(lǐng)域,將進(jìn)一步提高智能檢索技術(shù)實(shí)時(shí)分析能力及對(duì)大規(guī)模數(shù)據(jù)的檢索能力。(2)在很多應(yīng)用領(lǐng)域中,由經(jīng)典本體支持的形式化概念不足以表示不確定信2山東輕T業(yè)學(xué)院碩上學(xué)位論文息,本文在研究模糊邏輯相關(guān)理論的基礎(chǔ)上,提出將模

5、糊邏輯隸屬度加入概念相似度計(jì)算公式,以提高查詢速度和準(zhǔn)確率。(3)針對(duì)傳統(tǒng)向量空間模型存在的缺陷,本文擬提出了一種基于模糊本體的語(yǔ)義檢索向量空間模型,并對(duì)該模型相關(guān)技術(shù)進(jìn)行了詳細(xì)介紹。(4)課題研發(fā)一個(gè)文本分析工具的原型。該工具將能對(duì)word、excel、pdf文件進(jìn)行關(guān)鍵詞有效檢索,并能對(duì)特定領(lǐng)域(計(jì)算機(jī)取證領(lǐng)域)相關(guān)詞匯進(jìn)行語(yǔ)義檢索。1.5文章組織結(jié)構(gòu)全文共分六章,具體結(jié)構(gòu)為:第一章,緒論。介紹該論文的選題目的和研究意義,闡述本體國(guó)內(nèi)外研究現(xiàn)狀、本課題主要研究?jī)?nèi)容以及論文主要?jiǎng)?chuàng)新點(diǎn)。第二章,探討了信息檢索的

6、基本原理,詳細(xì)闡述了信息檢索技術(shù)涉及的信息表示、信息檢索過(guò)程和信息檢索結(jié)果三個(gè)方面。第三章,闡述了本體技術(shù)的定義、分類、構(gòu)成、表述語(yǔ)言、本體的建模原語(yǔ)和構(gòu)建工具等八個(gè)方面,以及本體在信息檢索中的應(yīng)用。第四章,構(gòu)建了基于領(lǐng)域本體的信息檢索系統(tǒng)結(jié)構(gòu)模型,闡述具體實(shí)現(xiàn)過(guò)程和主要算法。第五章,對(duì)模糊本體概念映射進(jìn)行了深入的研究,并實(shí)現(xiàn)基于本體的信息檢索系統(tǒng)。第六章,對(duì)研究?jī)?nèi)容進(jìn)行總結(jié)與對(duì)未來(lái)研究的展望。第2章信息檢索技術(shù)本章首先介紹了信息檢索模型的概念,探討了信息檢索的基本原理,然后詳細(xì)闡述了信息檢索技術(shù)涉及的信息表示

7、、信息檢索過(guò)程和信息檢索結(jié)果等三個(gè)方面的內(nèi)容,最后概括了當(dāng)前信息檢索存在的不足。2.1信息檢索模型的概念信息檢索是信息資源與信息需求的匹配過(guò)程,是通過(guò)~定的算法尋找信息資源與信息需求的交集的過(guò)程。由于信息資源空間和信息需求空間的不確定性,信息檢索是信息需求向信息資源不斷靠近的過(guò)程,是一個(gè)摸索的過(guò)程,是一個(gè)逐步求精的過(guò)程【l6,17J。信息資源是實(shí)現(xiàn)信息檢索的基礎(chǔ),原始的文檔中包括文本、圖像、視頻、音頻等數(shù)據(jù),不能直接進(jìn)行檢索,需要從這些原始數(shù)據(jù)中抽取邏輯視圖,支持信息檢索。用戶用查詢來(lái)表示他的信息需求。檢索系統(tǒng)

8、根據(jù)查詢的表示,搜索文檔集,獲取與用戶查詢相關(guān)的文檔。信息檢索的匹配是相似度匹配,查詢的結(jié)果按序返回。以上過(guò)程實(shí)際上涉及個(gè)重要的處理文檔集和查詢的表示、相似匹配及排序。對(duì)這些檢索的因素和過(guò)程建模,我們把信息檢索模型定義為:一個(gè)信息檢索模型是將文檔表示、查詢以及它們之間的關(guān)系進(jìn)行建模的框架,它由三元組表示:FED,Q,R(qi,dj)】式(2.1)其中D是文檔集中的一組文檔邏輯視圖(或稱

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。