資源描述:
《領(lǐng)域本體的概念相似度計(jì)算》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、領(lǐng)域本體的概念相似度計(jì)算陳杰,蔣祖華(上海交通大學(xué)機(jī)械與動力工程學(xué)院,上海200030)E-mail:jchanwl@126.com摘要:隨著本體在信息檢索、人工智能等領(lǐng)域的廣泛應(yīng)用,面向本體的概念相似度計(jì)算成為了本體研究的一大熱點(diǎn)。當(dāng)前領(lǐng)域本體中概念相似度的研究主要是利用概念的上下位關(guān)系進(jìn)行計(jì)算,但這并沒有完整反映出概念的語義信息。論文提出的算法將概念相似度計(jì)算分為兩層,一層是概念語義初始相似度層,其主要利用概念之間的距離來計(jì)算概念的初始相似度。另一層是概念非上下位關(guān)系相似度層,其在概念初始相似度的基礎(chǔ)上,計(jì)算概念通過非上下位關(guān)系體現(xiàn)出的相似度。最后通過綜合計(jì)算,得到領(lǐng)域本體中概念的實(shí)際相似
2、度。實(shí)驗(yàn)證明,該方法充分利用了本體中概念的語義信息,得到的結(jié)果也比較合理。關(guān)鍵詞:領(lǐng)域本體;概念相似度;語義距離文章編號:1002-8331(2006)33-0163-04文獻(xiàn)標(biāo)識碼:A中圖分類號:TP18ConceptSimilarityComputationforDomainOntologyCHENJie,JIANGZu-hua(SchoolofMechanicalEng.,ShanghaiJiaotongUniv.,Shanghai200030,China)Abstract:Withthewidespreadapplicationofontologyinthefieldsofinform
3、ationretrieval,artificialintelligenceetc,theconceptsimilaritycomputationofdomainontologyhasbecomethefocusresearchfield.Currently,mostresearchonconceptsimilaritycomputationisbasedon“isa”relationbetweenconcepts,however,itdoesnotutilizetheconceptsemanticinformationcompletely.Themethodproposedintheartic
4、ledividestheconceptsimilaritycomputationintotwolevels.Oneisthelayerofconceptsemanticinitialsimilaritywhichcomputestheconceptinitialsimilaritybasedonthedistancebetweenconcepts.Theotheroneisthelayerofconceptnon-hyponymyrelationshipsimilarity.Basedontheconceptinitialsimilarity,itcomputesthesimilarityre
5、flectedbythenon-hyponymyrelations.Andthroughintegrationcomputation,wecangetthetrueconceptsimilarity.Theexperimentshowsthatthemethodutilizestheconceptsemanticinformationfullyandthecomputationresultisreasonable.Keywords:domainontology;conceptsimilarity;semanticdistance1引言則利用了HowNet將概念之間的相似度計(jì)算轉(zhuǎn)化為對概念的本體
6、在軟件工程、人工智能、信息檢索、Web服務(wù)發(fā)現(xiàn)[1]等義原之間的相似度計(jì)算,通過計(jì)算義原間的距離確定概念相似度。另一種是利用大規(guī)模的語料庫進(jìn)行統(tǒng)計(jì)[6]?;诮y(tǒng)計(jì)的領(lǐng)域中扮演著越來越重要的角色。領(lǐng)域本體可以有效地組織領(lǐng)域中的知識,使知識更好地共享、重用。但是在利用本體的同方法將概念的上下文信息的概率分布作為概念語義相似度計(jì)時(shí),如何提高概念相似度計(jì)算精度卻成了本體應(yīng)用的一個(gè)“瓶算的參照。根據(jù)本體的定義[7,8]和描述,領(lǐng)域本體反映了一個(gè)對給定領(lǐng)頸”。例如在基于本體的知識檢索領(lǐng)域,提高檢索的查準(zhǔn)率和查全率一直是困擾人們的難題。而概念的相似度計(jì)算又是知識檢域的通用觀點(diǎn),其通過定義概念與概念之間的關(guān)系
7、來描述概念索過程中的進(jìn)行概念語義擴(kuò)展的重要步驟,如何提高概念相的語義信息。在實(shí)際的領(lǐng)域本體中,由于概念之間不僅僅存在似度計(jì)算精度就成了提高檢索質(zhì)量的關(guān)鍵技術(shù)之一。著上下位關(guān)系,概念之間通過其他各種關(guān)系可以連接,這使得針對概念相似度計(jì)算,業(yè)內(nèi)已有不少相關(guān)的研究。研究方概念的組織形式并不完全是一個(gè)樹型結(jié)構(gòu),而是一個(gè)網(wǎng)狀結(jié)向主要可分為兩種:基于概念信息容量法[2]和基于概念距離法[3]。構(gòu)。目前基于概念