資源描述:
《基于本體的Deep Web語義分類研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第25卷第2期山東建筑大學(xué)學(xué)報(bào)Vo1.25No.22010焦4月JOURNALOFSHANDONGJIANZHUUNIVERSITYApr.2010文章編號(hào):1673—7644(2010)02—0l18—07基于本體的DeepWeb語義分類研究呂強(qiáng),宋玲。,馬軍。,秦英林(1.國家電網(wǎng)技術(shù)學(xué)院,山東濟(jì)南250002;2.山東建筑大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東濟(jì)南250101;3.山東大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東濟(jì)南250100)摘要:針對(duì)目前DeepWeb分類研究中所采用的Post—query查尋探測方法缺乏語義支持的問題
2、,提出一個(gè)基于本體的語義查詢探測分類方法。主要思想如下:首先針對(duì)一個(gè)DeepWeb數(shù)據(jù)庫集合,提取查詢接口中的屬性及其實(shí)例,半自動(dòng)建立領(lǐng)域本體,并且通過領(lǐng)域本體來表示類別特征;然后利用領(lǐng)域本體中的概念以及相應(yīng)的實(shí)例構(gòu)造語義查詢集;最后對(duì)待分類的DeepWeb數(shù)據(jù)庫利用語義查詢集進(jìn)行查詢探測,計(jì)算查詢探測返回的結(jié)果文檔在領(lǐng)域本體中的信息覆蓋量,并以此對(duì)DeepWeb進(jìn)行分類。實(shí)驗(yàn)表明:這種語義查詢探測分類的方法和以往的方法相比,在準(zhǔn)確率、查全率和F1值上有一定的提高。關(guān)鍵詞:DeepWeb分類;本體;語義;查詢探測中圖分類號(hào):
3、TP301文獻(xiàn)標(biāo)識(shí)碼:AResearchonDeepWebsemanticcategorizationbasedonontologyLUQiang,SONGLing2,MAJun,eta1.(1.StateGridTechnologyCollege,Jinan250002,China;2.SchoolofComputerScienceandTechnology,ShandongJianzhuUniversity,Jinan250101,China;3.SchoolofComputerScienceandTechnology,
4、ShandongUniversity,Jinan250100,China)Abstract:InviewoftheproblemoflackingsemanticsupportinthePost-queryresearchofDeepWebdatabasesclassification,thepaperdesignsanovelsemanticqueryprobingclassificationapproachbasedonontology.Themainideaisasfollowing:firstly,attribute
5、sandinstancesareextractedfromqueryinterface,whichareusedtobuilddomainontologiessemi—automatically,andcharacteristicsofcategoriesarerepresentedbydomainontologies.Thendomainqueryinstancesareconstructedfromdomainontologies,whichareusedasqueryprobingtoDeepWebdatabases.
6、Finallycoveragedegreebetweenreturnedresultdocumentsofaqueryanddomainontologiesarecomputed,withwhichtheDeepWebdatabaseisclassified.TheexperimentsshowthatsemanticqueryprobingclassificationmethodWeproposedhasimprovedalotinprecision,recallandF1.Keywords:DeepWebcategori
7、zation;ontology;semanticquery;queryprobing收稿日期:2009一O8—21基金項(xiàng)目:高等學(xué)校博士學(xué)科點(diǎn)專向科研基金(20070422107);山東省科技攻關(guān)計(jì)劃項(xiàng)目(2007GG10001002)作者簡介:呂強(qiáng)(1969一)男,山東平度人,副教授,碩士,主要從事計(jì)算智能電網(wǎng)、智能在電力系統(tǒng)中的應(yīng)用研究.E-mail:sllshm@sina.t:om第2期呂強(qiáng)等:基于本體的DeepWeb語義分類研究詞并進(jìn)行不同的組合,用來對(duì)隱藏?cái)?shù)據(jù)庫進(jìn)行探測,0引言并以此來確定某個(gè)隱藏?cái)?shù)據(jù)庫對(duì)于某領(lǐng)域的
8、相關(guān)度。近來研究表明網(wǎng)絡(luò)上存在的大量DeepWeb數(shù)通過對(duì)未知的DeepWeb數(shù)據(jù)庫反復(fù)地查詢探據(jù)庫只有通過用戶提交一系列關(guān)鍵詞給查詢接口后測,對(duì)返回查詢結(jié)果進(jìn)行分析來判斷一個(gè)DeepWeb才能動(dòng)態(tài)生成查詢結(jié)果,因此對(duì)用戶來說這部分頁數(shù)據(jù)庫屬于哪個(gè)領(lǐng)域,這就面臨一個(gè)如何構(gòu)造查詢面是隱藏的,