基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)

基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)

ID:33287591

大?。?.14 MB

頁數(shù):67頁

時(shí)間:2019-02-23

基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)_第1頁
基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)_第2頁
基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)_第3頁
基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)_第4頁
基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)_第5頁
資源描述:

《基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、分類號(hào):——UDC:——密級(jí):——編號(hào):——工學(xué)碩士學(xué)位論文基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)碩士研究生:指導(dǎo)教師:學(xué)位級(jí)別:學(xué)科、專業(yè):所在單位:論文提交日期:論文答辯日期:學(xué)位授予單位:陳紹琛劉大昕教授工學(xué)碩士計(jì)算機(jī)軟件與理論計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2009年1月2009年2月哈爾濱工程大學(xué)哈爾濱工程大學(xué)碩士學(xué)位論文摘要近年來,本體在信息檢索和語義網(wǎng)等領(lǐng)域中發(fā)揮著越來越重要的作用。但是手工構(gòu)造本體卻是一項(xiàng)繁瑣的工作。如何從大量中文文獻(xiàn)中自動(dòng)或半自動(dòng)地獲得本體,成為本體在中文環(huán)境下推廣、應(yīng)用的一個(gè)重要課題。本體學(xué)習(xí)是指利用人工智能、自然語言處理等眾多學(xué)科

2、技術(shù)來實(shí)現(xiàn)本體的半自動(dòng)構(gòu)建。本體學(xué)習(xí)任務(wù)主要包括本體所包含的各個(gè)元素的自動(dòng)或半自動(dòng)獲取,例如概念獲取以及概念間關(guān)系的獲取等。本文在借鑒國內(nèi)外現(xiàn)有本體學(xué)習(xí)理論、方法的基礎(chǔ)上,結(jié)合中文自然語言的研究成果,針對(duì)特定領(lǐng)域的中文文本文檔,對(duì)領(lǐng)域本體概念獲取和概念間關(guān)系的獲取展開了研究。在概念的獲取方面,本文提出以一種多策略中文本體概念獲取方法,綜合統(tǒng)計(jì)、中文分詞等技術(shù)半自動(dòng)地提取領(lǐng)域概念,并以領(lǐng)域一致度、領(lǐng)域相關(guān)度等統(tǒng)計(jì)方法篩選提取的概念。在提取概念關(guān)系方面,本文重點(diǎn)研究以語境模式的方法提取概念間關(guān)系。本文對(duì)語境模式進(jìn)行了較深入的研究,提出單旬模式、多句模式

3、和段模式三種不同的語境模式。另外,對(duì)語境模式的半自動(dòng)生成作初步的研究,并提出了若干算法。最后,本文實(shí)現(xiàn)了一個(gè)中文本體學(xué)習(xí)系統(tǒng)用以試驗(yàn)本文提出的方法的可行性。關(guān)鍵詞:本體;中文本體學(xué)習(xí);語境模式;概念獲?。活I(lǐng)域概念間關(guān)系獲取哈爾濱工程大學(xué)碩十學(xué)位論文AbstractIntherecentyears,ontologyisplayingamoreandmoreimportantroleinknowledgemanagementandthesemanticweb.Buttobuildtheontologybyhandisacomplicatedwork.I

4、thasbecomeanimportantsubjecttoacquireChineseOntologyfromcorpusofdifferentfieldsinordertoextendandimplementsemanticwebinChina.Theontologylearningaimsatbuildingontologyautomaticallyorsemi-automaticallybytheuseofartificialintelligence,naturallanguageprocessingandmanyotherareaofsc

5、ience.Theontologylearningreferstotheextractionoflearningcontentandusesthiscontenttoconstructontology.Themaintaskofontologylearningconsistsofautomaticorsemi-automaticacquisitionofeveryelementcontainedinontology,suchasconceptlearningandrelationlearning.BasedOiltheexistingontolog

6、ylearningtheory,methodsandtechniquesfromabroad,combiningtheresearchfruitsofChinesenaturallanguageprocessingfield,twoalgorithmsareraisedinthispaperontheconceptextractionandrelationextraction.Ontheconceptside,amethodcomesupwithbasedontheidea“differentconstructionofconceptondiffe

7、rentfield”.Andsiftconceptsbydomainrelevanceanddomainconsensus.Ontherelationextractionside,relationsareabstractedbythewayofsentencepattern.In-depthstudyWasdoneinthesentencepareranddivideditintosingle-sentencepattern、multi—sentencepatternandsegmentpattem.Somealgorithmsforsemi·au

8、tomaticgeneratingpattemareproposedhere.Finally,Chineseontolog

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。