資源描述:
《中文問答系統(tǒng)中問題分類的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中文問答系統(tǒng)中的問題分類研究摘要問答系統(tǒng)是一種能理解使用自然語言描述的問題,并在海量信息中進(jìn)行問題答案的準(zhǔn)確定位查找和答案合成的智能信息處理系統(tǒng),是數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)之一。問題分類則是問答系統(tǒng)處理問題過程中,用于對(duì)使用自然語言描述的問題進(jìn)行分類,盡量搜集充分的與問題相關(guān)的信息,以提高問答系統(tǒng)后續(xù)環(huán)節(jié)處理的準(zhǔn)確性和處理效率。本文主要針對(duì)中文問答系統(tǒng)中的問題分類進(jìn)行研究,利用中文語言和中文問題的特點(diǎn)以進(jìn)一步提高中文問題的分類精度,達(dá)到改善中文問答系統(tǒng)性能的目的。本文的主要研究工作如下:(1)在觀察和分析中文問題中的疑問詞和中心詞與問題分類之間關(guān)系的基礎(chǔ)上,對(duì)
2、基于詞性和啟發(fā)式規(guī)則來抽取疑問詞和中心詞方法,給出兩種詞性修正方法以提高抽取的準(zhǔn)確率,并根據(jù)自學(xué)習(xí)方法進(jìn)行規(guī)則訓(xùn)練;設(shè)計(jì)了一種采用自學(xué)習(xí)規(guī)則和貝葉斯模型相結(jié)合的問題分類方法,該方法克服了規(guī)則方法覆蓋率不高的缺點(diǎn)。實(shí)驗(yàn)表明了該方法的有效性。(2)為進(jìn)一步提高中心詞抽取方法的準(zhǔn)確性,本文就句法結(jié)構(gòu)信息在中文問題分類中的應(yīng)用進(jìn)行了探討,設(shè)計(jì)了一種利用句法結(jié)構(gòu)信息抽取中心詞的方法,并建立了相關(guān)抽取規(guī)則。實(shí)驗(yàn)驗(yàn)證了該方法的有效性。關(guān)鍵詞:中文問答系統(tǒng);問題分類;自學(xué)習(xí)規(guī)則;層次分類;句法結(jié)構(gòu)ResearchontheQuestionsClassificationint
3、heChineseQuestionAnsweringSystemAbstractChineseQuestionAnsweringSystem,whichisaresearchfocusingareasindatamining,isanintelligentinformationprocessingsystemwhichcanunderstandtheissuesdescribedinnaturallanguage,locatethecorrectpositionoftheanswerandsynthesizeanswerfromthemassinformat
4、ion.Questionclassification,asakeystepintheprocessofQuestionAnsweringSystem,isusedtoclassifythequestiondescribedinnaturallanguage,andtotrytocollectsufficientinformationrelatedtothequestionforimprovingtheaccuracyandefficiencyofthefollowingprocessstepsinQuestionAnsweringSystem.Mainwor
5、kofthisdissertationistostudyquestionclassificationintheChineseQuestionAnsweringsystem,andtrytofindanewclassificationmethodmakinguseofthecharactersofChineseandChinesequestionstoimprovetheclassificationaccuracyoftheChinesequestions,andatlasttoimprovetheperformanceoftheChineseQuestion
6、AnsweringSystem.ThisresearchprovidessomenewinsightsintoChinesequestionclassification:(1)Onthebasisoftheinvestigationontherelationbetweenkeywords,suchasquestionwordsandheadwords,andquestion’scategory,forextractingquestionwordsandheadwordsmoreaccurate,twomethodsbasedonpart-of-speech-
7、fixing,whichareusedtoimprovetheperformanceoftheexistingmethodbasedonpart-of-speechandheuristicrules,aregiven.AndaquestionclassificationmethodcombiningrulesandBayes,whichcanovercomethefaultsthatrule’scoverageisnothigh,isdesignedtoo.Empiricalresultsshowthevalidityofthemethod.(2)Tosol
8、vetheshortcomingsofheadwor