資源描述:
《語(yǔ)義web技術(shù)發(fā)展及基于語(yǔ)義web本體探究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、語(yǔ)義Web技術(shù)發(fā)展及基于語(yǔ)義Web本體探究摘要:該文介紹了當(dāng)前萬(wàn)維網(wǎng)存在的主要問(wèn)題,從問(wèn)題出發(fā),引入了語(yǔ)義Web的概念,并對(duì)語(yǔ)義Web的體系結(jié)構(gòu)及其發(fā)展進(jìn)行了闡述,同時(shí)對(duì)當(dāng)前基于語(yǔ)義Web的本體技術(shù)重點(diǎn)進(jìn)行了研究分析。關(guān)鍵詞:語(yǔ)義Web;描述邏輯;本體中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)23-5563-02SemanticWebTechnologyDevelopmentandResearchonSemanticWeb-basedOntologyTechnologyLIZhen-chao(Guang
2、dongWomen’sPolytechnicCollege,Guangzhou511450,China)Abstract:ThisarticledescribesthemainproblemsinthecurrentWorldWideWeb,issuesandawayfromtheintroductionoftheconceptoftheSemanticWebandSemanticWebarchitectureanddescribesitsdevelopment,atthesametime,studiesandanalysesthefo
3、cusonthecurrentSemanticWeb-basedontologytechnology.9Keywords:SemanticWeb;descriptionlogic;ontology1萬(wàn)維網(wǎng)現(xiàn)狀及存在的問(wèn)題1989年在歐洲的一個(gè)國(guó)際核能研究院中,TimBerners-lee提出了一份關(guān)于信息管理的研究計(jì)劃,該計(jì)劃將超文本技術(shù)應(yīng)用到計(jì)算機(jī)網(wǎng)絡(luò)之中,促成了萬(wàn)維網(wǎng)(WWW或Web)的誕生[1]。萬(wàn)維網(wǎng)誕生之后,得到了迅速的發(fā)展,并在人們的日常生活中發(fā)揮著越來(lái)越重要的作用。萬(wàn)維網(wǎng)是一個(gè)巨大的信息資源庫(kù),幾乎包含了任何領(lǐng)域的文檔和媒
4、體資源,并且允許用戶通過(guò)搜索引擎對(duì)數(shù)據(jù)進(jìn)行查找和訪問(wèn)。但是,在實(shí)際的應(yīng)用中,對(duì)萬(wàn)維網(wǎng)上進(jìn)行信息查詢還存在很多問(wèn)題[2]:(1)高匹配、低精度。在搜索主要相關(guān)頁(yè)面的同時(shí),還會(huì)搜到28758個(gè)低相關(guān)或不相關(guān)的頁(yè)面,檢索效果非常差。(2)低匹配或無(wú)匹配。搜索到的結(jié)果漏掉了一些重要的相關(guān)頁(yè)面,或者搜索不到任何有用的結(jié)果。(3)檢索結(jié)果對(duì)詞匯高度敏感。在使用最初填寫的關(guān)鍵詞進(jìn)行搜索時(shí),不能得到想要的結(jié)果,只能得到相似的結(jié)果,因?yàn)橄嚓P(guān)的文檔里可能使用了與檢索關(guān)鍵詞不一樣的術(shù)語(yǔ)。(4)檢索結(jié)果是單一的網(wǎng)頁(yè)。假如需要的信息分布在不同的文檔中,則需要用多
5、個(gè)查詢來(lái)收集相關(guān)的頁(yè)面,再對(duì)這些頁(yè)面中的相關(guān)信息進(jìn)行提取后組織成一個(gè)整體。9(5)搜索結(jié)果與其它軟件處理的兼容性差。即使搜索到了需要的頁(yè)面,但由于其他軟件對(duì)現(xiàn)有網(wǎng)絡(luò)搜索的結(jié)果不容易進(jìn)一步處理,對(duì)極其耗時(shí)的信息檢索本身來(lái)說(shuō),搜索引擎并不能提供太多的支持,可以說(shuō)搜索引擎的應(yīng)用往往是孤立的。2語(yǔ)義Web的提出以上問(wèn)題的原因在于目前的萬(wàn)維網(wǎng)是面向人而不是面向機(jī)器,人可以理解萬(wàn)維網(wǎng)上Web頁(yè)面的內(nèi)容,但機(jī)器卻只能對(duì)Web頁(yè)面進(jìn)行簡(jiǎn)單的顯示,不能真正理解內(nèi)容的含義,也就不能對(duì)其進(jìn)行自動(dòng)處理。這使得萬(wàn)維網(wǎng)上的一些應(yīng)用(如智能Agent、信息檢索、電子
6、商務(wù)等)無(wú)法真正實(shí)現(xiàn)智能化和自動(dòng)化[1]。為了使計(jì)算機(jī)能夠理解和處理網(wǎng)頁(yè)內(nèi)容,迅速準(zhǔn)確地從海量Web頁(yè)面中查找需要的內(nèi)容,Tim9Berners-Lee于1998年首次提出了語(yǔ)義網(wǎng)的概念,并且于2000年在召開(kāi)的XML2000會(huì)議上進(jìn)一步明確闡明了語(yǔ)義Web[3][4]。語(yǔ)義Web是對(duì)現(xiàn)有Web增加語(yǔ)義支持,是對(duì)現(xiàn)有萬(wàn)維網(wǎng)的變革和延伸,目標(biāo)是使網(wǎng)絡(luò)中的信息都具有語(yǔ)義,并幫助計(jì)算機(jī)在一定程度上理解信息的含義,從而實(shí)現(xiàn)高效的信息共享和機(jī)器智能協(xié)同。簡(jiǎn)單地說(shuō),語(yǔ)義Web是以數(shù)據(jù)的內(nèi)容,即數(shù)據(jù)的語(yǔ)義為核心,用機(jī)器能夠理解和處理的方式鏈接起來(lái)的海
7、量分布式數(shù)據(jù)庫(kù)[5]。因而語(yǔ)義Web研究的重點(diǎn)就是如何把信息知識(shí)表示成計(jì)算機(jī)能夠理解和處理的形式,使信息帶有語(yǔ)義。3語(yǔ)義Web體系結(jié)構(gòu)語(yǔ)義Web的實(shí)現(xiàn)是以現(xiàn)有的網(wǎng)絡(luò)環(huán)境為基礎(chǔ),通過(guò)對(duì)其增加協(xié)議層來(lái)逐步提供語(yǔ)義Web承諾的各項(xiàng)功能,換句話說(shuō),高層是在低層的基礎(chǔ)上對(duì)其進(jìn)行功能的擴(kuò)展。在語(yǔ)義Web中,低層到高層的擴(kuò)展,應(yīng)該遵循以下兩個(gè)原則[2]:(1)向下可兼容性。位于高層的代理應(yīng)能理解和使用低層的相關(guān)信息。(2)向上部分可理解性。位于低層的代理可以部分地使用高層的信息。TimBerners-Lee給出了語(yǔ)義Web體系結(jié)構(gòu)圖,如圖1所示[4]
8、[6]:圖1語(yǔ)義Web的體系結(jié)構(gòu)第一層:Unicode和URI層。該層是語(yǔ)義Web的基礎(chǔ),其它各層都是在本層的基礎(chǔ)上實(shí)現(xiàn)的。Unicode是一個(gè)字符集,它的功能是對(duì)Web中的資源進(jìn)行統(tǒng)一編碼,保證網(wǎng)絡(luò)用戶使