資源描述:
《基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號(hào):——UDC:——密級(jí):——編號(hào):——工學(xué)碩士學(xué)位論文基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)碩士研究生:指導(dǎo)教師:學(xué)位級(jí)別:學(xué)科、專業(yè):所在單位:論文提交日期:論文答辯日期:學(xué)位授予單位:陳紹琛劉大昕教授工學(xué)碩士計(jì)算機(jī)軟件與理論計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2009年1月2009年2月哈爾濱工程大學(xué)哈爾濱工程大學(xué)碩士學(xué)位論文摘要近年來,本體在信息檢索和語義網(wǎng)等領(lǐng)域中發(fā)揮著越來越重要的作用。但是手工構(gòu)造本體卻是一項(xiàng)繁瑣的工作。如何從大量中文文獻(xiàn)中自動(dòng)或半自動(dòng)地獲得本體,成為本體在中文環(huán)境下推廣、應(yīng)用的一個(gè)重要課題。本體學(xué)習(xí)是指利用人工智能、自然語言處理等眾多學(xué)科
2、技術(shù)來實(shí)現(xiàn)本體的半自動(dòng)構(gòu)建。本體學(xué)習(xí)任務(wù)主要包括本體所包含的各個(gè)元素的自動(dòng)或半自動(dòng)獲取,例如概念獲取以及概念間關(guān)系的獲取等。本文在借鑒國內(nèi)外現(xiàn)有本體學(xué)習(xí)理論、方法的基礎(chǔ)上,結(jié)合中文自然語言的研究成果,針對(duì)特定領(lǐng)域的中文文本文檔,對(duì)領(lǐng)域本體概念獲取和概念間關(guān)系的獲取展開了研究。在概念的獲取方面,本文提出以一種多策略中文本體概念獲取方法,綜合統(tǒng)計(jì)、中文分詞等技術(shù)半自動(dòng)地提取領(lǐng)域概念,并以領(lǐng)域一致度、領(lǐng)域相關(guān)度等統(tǒng)計(jì)方法篩選提取的概念。在提取概念關(guān)系方面,本文重點(diǎn)研究以語境模式的方法提取概念間關(guān)系。本文對(duì)語境模式進(jìn)行了較深入的研究,提出單旬模式、多句模式
3、和段模式三種不同的語境模式。另外,對(duì)語境模式的半自動(dòng)生成作初步的研究,并提出了若干算法。最后,本文實(shí)現(xiàn)了一個(gè)中文本體學(xué)習(xí)系統(tǒng)用以試驗(yàn)本文提出的方法的可行性。關(guān)鍵詞:本體;中文本體學(xué)習(xí);語境模式;概念獲?。活I(lǐng)域概念間關(guān)系獲取哈爾濱工程大學(xué)碩十學(xué)位論文AbstractIntherecentyears,ontologyisplayingamoreandmoreimportantroleinknowledgemanagementandthesemanticweb.Buttobuildtheontologybyhandisacomplicatedwork.I
4、thasbecomeanimportantsubjecttoacquireChineseOntologyfromcorpusofdifferentfieldsinordertoextendandimplementsemanticwebinChina.Theontologylearningaimsatbuildingontologyautomaticallyorsemi-automaticallybytheuseofartificialintelligence,naturallanguageprocessingandmanyotherareaofsc
5、ience.Theontologylearningreferstotheextractionoflearningcontentandusesthiscontenttoconstructontology.Themaintaskofontologylearningconsistsofautomaticorsemi-automaticacquisitionofeveryelementcontainedinontology,suchasconceptlearningandrelationlearning.BasedOiltheexistingontolog
6、ylearningtheory,methodsandtechniquesfromabroad,combiningtheresearchfruitsofChinesenaturallanguageprocessingfield,twoalgorithmsareraisedinthispaperontheconceptextractionandrelationextraction.Ontheconceptside,amethodcomesupwithbasedontheidea“differentconstructionofconceptondiffe
7、rentfield”.Andsiftconceptsbydomainrelevanceanddomainconsensus.Ontherelationextractionside,relationsareabstractedbythewayofsentencepattern.In-depthstudyWasdoneinthesentencepareranddivideditintosingle-sentencepattern、multi—sentencepatternandsegmentpattem.Somealgorithmsforsemi·au
8、tomaticgeneratingpattemareproposedhere.Finally,Chineseontolog