基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)

基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)

ID:5267730

大?。?07.00 KB

頁(yè)數(shù):8頁(yè)

時(shí)間:2017-12-07

基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)_第1頁(yè)
基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)_第2頁(yè)
基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)_第3頁(yè)
基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)_第4頁(yè)
基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)_第5頁(yè)
資源描述:

《基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。

1、http://www.paper.edu.cn1基于本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)1,2111劉杰,樊孝忠,陳康,陶利強(qiáng)1北京理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,北京(10081)2首都師范大學(xué)信息工程學(xué)院,北京(10037)E-mail:liujxxxy@bit.edu.cn摘要:提出了一種應(yīng)用本體知識(shí)庫(kù)的受限領(lǐng)域自動(dòng)問(wèn)答(QA)系統(tǒng)結(jié)構(gòu),采用OWL語(yǔ)言描述領(lǐng)域本體知識(shí)庫(kù),通過(guò)Jena推理機(jī)從領(lǐng)域本體知識(shí)庫(kù)中推理、抽取答案,提高了QA系統(tǒng)回答問(wèn)題的準(zhǔn)確性。文章以某不孕不育醫(yī)院QA為例,分析了系統(tǒng)結(jié)構(gòu)及實(shí)現(xiàn)過(guò)程,對(duì)問(wèn)句分析、領(lǐng)域本體知識(shí)庫(kù)的構(gòu)建、答案

2、抽取進(jìn)行了詳細(xì)闡述。測(cè)試結(jié)果表明,準(zhǔn)確率達(dá)到83.5%,召回率達(dá)到92%。關(guān)鍵詞:受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng);本體知識(shí)庫(kù);OWL中圖分類號(hào):TP3911.引言傳統(tǒng)的搜索引擎根據(jù)用戶提供的關(guān)鍵字返回相關(guān)網(wǎng)頁(yè),用戶往往面對(duì)返回的大量網(wǎng)頁(yè)無(wú)所適從,不能很快的找到自己需要的內(nèi)容,而自動(dòng)問(wèn)答系統(tǒng)既能用自然語(yǔ)言句子提問(wèn),又能為用戶直接返回所需的答案,而不是相關(guān)的網(wǎng)頁(yè)。所以,問(wèn)答系統(tǒng)能更好的滿足用戶的檢索需求,能更快地找出用戶所需的答案。[1]起源于哲學(xué)的本體論(ontology)近年來(lái)受到信息領(lǐng)域的廣泛關(guān)注,并得到廣泛應(yīng)用,[2]尤其是W3C國(guó)際標(biāo)準(zhǔn)本體描述語(yǔ)言

3、OWL(ontologyWeblanguage)以描述邏輯為基礎(chǔ),在一定程度上促進(jìn)了本體在各領(lǐng)域的應(yīng)用。應(yīng)用本體思想構(gòu)建知識(shí)庫(kù)可根據(jù)問(wèn)句分析結(jié)果對(duì)答案推理,對(duì)受限領(lǐng)域QA答案提取的準(zhǔn)確性、知識(shí)共享、知識(shí)重用起到重要作用,本文提出了一種基于OWL語(yǔ)言描述領(lǐng)域本體知識(shí)庫(kù)的受限領(lǐng)域QA系統(tǒng)解決方案,并成功應(yīng)用在一個(gè)不孕不育醫(yī)院自動(dòng)問(wèn)答系統(tǒng)中。2系統(tǒng)結(jié)構(gòu):2.1系統(tǒng)設(shè)計(jì)思想使用基于描述邏輯的OWL語(yǔ)言描述本體庫(kù),有利于QA的答案抽取,使用Jena推理機(jī)可直接在OWL語(yǔ)言描述的本體知識(shí)庫(kù)里進(jìn)行答案的推理、查找,并且Jena推理機(jī)支持自定義規(guī)則。知識(shí)庫(kù)的結(jié)

4、構(gòu)必須要有相對(duì)應(yīng)的問(wèn)句分析的結(jié)果向量,因此我們改進(jìn)了以語(yǔ)義塊為基礎(chǔ)的問(wèn)句模板及結(jié)構(gòu)化問(wèn)句實(shí)例的問(wèn)句向量分析方法,服務(wù)于答案抽取。該系統(tǒng)結(jié)構(gòu)圖如圖1所示。1本課題得到教育部高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(項(xiàng)目名稱:受限領(lǐng)域自動(dòng)問(wèn)答系統(tǒng),項(xiàng)目編號(hào):20050007023)資助-1-http://www.paper.edu.cn知網(wǎng)提交問(wèn)題返回答案通用詞庫(kù)預(yù)處理模塊答案抽取模塊領(lǐng)域詞庫(kù)領(lǐng)域本體知識(shí)同義詞庫(kù)庫(kù)用戶交互問(wèn)句模板庫(kù)問(wèn)句分析問(wèn)句實(shí)例庫(kù)匹配生成問(wèn)句向量不成功成功圖1受限領(lǐng)域QA系統(tǒng)結(jié)構(gòu)圖2.2領(lǐng)域知識(shí)資源的組織(1)通用詞庫(kù):本系統(tǒng)選擇中科院的

5、研究成果通用詞庫(kù)CoreDict.dct,大約收錄了十多萬(wàn)詞條和標(biāo)點(diǎn),含有詞性標(biāo)注,以二進(jìn)制文件形式存儲(chǔ)。(2)知網(wǎng):《知網(wǎng)》是一部比較詳盡的語(yǔ)義知識(shí)詞典,是一個(gè)以漢語(yǔ)和英語(yǔ)的詞語(yǔ)所代表的概念為描述對(duì)象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)。知網(wǎng)中的每個(gè)詞語(yǔ)由DEF來(lái)描述其概念定義,DEF由若干個(gè)義原及它們與主干詞之間的語(yǔ)義關(guān)系描述組成。系統(tǒng)利用知網(wǎng)輔助問(wèn)句語(yǔ)義塊的分析和問(wèn)句相似度計(jì)算。(3)本體知識(shí)庫(kù):通過(guò)分析專業(yè)領(lǐng)域知識(shí),提取領(lǐng)域本體概念、概念之間的關(guān)系、實(shí)例、屬性等本體元素構(gòu)成本體庫(kù)。采用w3c國(guó)際標(biāo)準(zhǔn)

6、語(yǔ)言owl描述醫(yī)院本體庫(kù),形成本體知識(shí)庫(kù)。(4)領(lǐng)域詞庫(kù):包括類詞庫(kù)、實(shí)例詞庫(kù)、屬性詞庫(kù),分別存放本體知識(shí)庫(kù)中的類名、實(shí)例名、屬性名,首次運(yùn)行系統(tǒng)時(shí)可由機(jī)器讀取本體知識(shí)庫(kù)文件把類名、實(shí)例名、屬性名自動(dòng)加入到類詞庫(kù)、實(shí)例詞庫(kù)、屬性詞庫(kù)中。問(wèn)句分詞時(shí)領(lǐng)域詞優(yōu)先切分。用戶更新本體知識(shí)庫(kù)后系統(tǒng)可自動(dòng)更新領(lǐng)域詞庫(kù)。3本體知識(shí)庫(kù)的構(gòu)建:領(lǐng)域知識(shí)庫(kù)是受限領(lǐng)域QA系統(tǒng)的關(guān)鍵組成部分,用基于描述邏輯(DL)的OWL語(yǔ)言描述本體知識(shí)庫(kù),對(duì)根據(jù)問(wèn)句分析的結(jié)果在領(lǐng)域本體知識(shí)庫(kù)中進(jìn)行推理提供了依據(jù),并且問(wèn)答系統(tǒng)的問(wèn)句分析和答案抽取都以本體知識(shí)庫(kù)的構(gòu)建為基礎(chǔ)。-2-htt

7、p://www.paper.edu.cn3.1領(lǐng)域本體庫(kù)的構(gòu)建領(lǐng)域本體庫(kù)的構(gòu)建包括類(概念)、實(shí)例、關(guān)系等元素的提取,需要領(lǐng)域?qū)<业膮⑴c。本系統(tǒng)開發(fā)了機(jī)器輔助程序,結(jié)合手工的方法,在領(lǐng)域?qū)<业闹笇?dǎo)下,采取自頂而下的方法提取本體元素。具體步驟包括:(1)文本搜集、整理(2)概念抽取、分類(3)關(guān)系抽取。抽取顆粒大小取決于問(wèn)答系統(tǒng)答案抽取的需求,本系統(tǒng)顆粒細(xì)化到每個(gè)具體癥狀和具體治療方法,如“炎癥性水腫”“微波治療”等。3.2領(lǐng)域本體知識(shí)庫(kù)的構(gòu)建領(lǐng)域本體庫(kù)采用采用OWL語(yǔ)言描述后即成為領(lǐng)域本體知識(shí)庫(kù),OWL是2002年正式成為[3]W3C推薦的We

8、bOntology表示語(yǔ)言。OWL采用面向?qū)ο蟮姆绞絹?lái)描述領(lǐng)域知識(shí),即通過(guò)類和屬性來(lái)描述對(duì)象,并通過(guò)公理(Axioms)來(lái)描述這些類和屬性的特征和關(guān)系

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。