基于語義模板的問答系統(tǒng)研究

基于語義模板的問答系統(tǒng)研究

ID:37383431

大小:584.36 KB

頁數(shù):5頁

時間:2019-05-22

基于語義模板的問答系統(tǒng)研究_第1頁
基于語義模板的問答系統(tǒng)研究_第2頁
基于語義模板的問答系統(tǒng)研究_第3頁
基于語義模板的問答系統(tǒng)研究_第4頁
基于語義模板的問答系統(tǒng)研究_第5頁
資源描述:

《基于語義模板的問答系統(tǒng)研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。

1、V亂扣qBhdA--rNN句O)3第24卷第3期深圳大學學報理工版qB川句2007年7月JOURNALOFSHENZHENUNIVERSITYSCIENCEANDENGINEERINGI文章編號:1000-2618(2007)03-0281-05基于語義模板的問答系統(tǒng)研究梁正平1,紀震1,劉小麗2(1.深圳大學軟件學院,深圳518060;2.香港城市大學計算機科學系,香港)摘要:提出一個基于語義模板的用戶交互問答系統(tǒng),其中語義模板用于標識句子中各成分之間的語義關聯(lián)關系.語義模板的使用有助于問題的分解和各成分問語義關聯(lián)關系的研究,可提高分析精度,適宜于英文和中文問題的分

2、析.在系統(tǒng)運行中,將問題和用戶選擇的正確答案對,存儲在數(shù)據(jù)庫中,通過積累知識構(gòu)建知識庫,實現(xiàn)問題自動回答.關鍵詞:語義模板;問答系統(tǒng);模式匹配;語義相似度;用戶交互;問題/答案對中圖分類號:TP391.1;TP311.5文獻標識碼:A問答系統(tǒng)是集自然語言處理技術和信息檢索技的語義關系模糊,嚴重妨礙問題分析的深度和答案術于一身的新一代搜索引擎[1-2J該系統(tǒng)中,用戶的準確度.用自然語言進行提問,以期獲得一個簡潔、準確的圍繞問答系統(tǒng)中句子成分之間的語義關系,LitkowskiK[6J答案.雖然現(xiàn)有的搜索引擎,如Google、Yahoo和利用模式分析句子成分間的語義關聯(lián)J百

3、度等,可搜索到與關鍵詞相關的信息,但仍存在關系,LiS[7利用語義分析單詞間的關系,Deepak信息丟失、返回信息過多、信息無關等不足.問答R[8J和NarayananS[9J等則將淺層文本模式和基于語系統(tǒng)設計的目的,是為用戶提供真正有用且精確的義結(jié)構(gòu)分析方法用于問答系統(tǒng)中.以上研究都為語信息,它是新一代搜索引擎的選擇之一.義和模式在問答系統(tǒng)中的運用做了很好的鋪墊,但問答系統(tǒng)的研究涉及知識表示、信息檢索和自仍未將語義和模式結(jié)合起來.而WuM口0],Dmitri然語言處理等諸多技術.需從問題處理、檢索系統(tǒng)R[l1J和SneidersE[口]等雖采用模式匹配的方法進行和答

4、案抽取3方面進行分析研究,其關鍵在于問題問題分析,但僅采用簡單文本段或者Web信息作為分析和答案抽取.目前,多數(shù)問答系統(tǒng)均采用自然語料庫,不能發(fā)揮語義模式的優(yōu)勢.語言處理技術進行問題分析和答案抽取,所采用的本文將語義和模式相結(jié)合的語義模板應用于用語料庫通常是文本信息和Web信息等非結(jié)構(gòu)化的信戶交互的問答系統(tǒng),利用模式匹配的方法進行問題息庫,而不是具有語義關聯(lián)關系的知識庫.分析.在系統(tǒng)運行過程中,通過保存問題和用戶選問答系統(tǒng)研究的關鍵在于提高問題分析的深度擇的正確答案對構(gòu)建一個由問題/答案對組成的知和答案的準確度.僅用自然語言處理技術來進行問識庫(問答庫).由于問題使用

5、語義模板進行分析J題分析的效果并不理想.為此,SandaM[3和Roth和存儲,故可充分利用現(xiàn)有各種模式匹配方法的優(yōu)D[4J等運用多種自然語言處理技術相結(jié)合的方法及點來進行問題分析.機器學習技術來研究問答系統(tǒng),HarabagiuD等[5J則在問題分析中運用反饋方法.這些方法在一定程1語義模板度上可提高答案的準確度,但在問題分析技術上并無實質(zhì)性的突破,僅將問題分析和答案抽取技術進現(xiàn)有的各種問題分析方法主要基于自然語言的行了轉(zhuǎn)移.尤其在這些方法中,由于句子成分之間處理技術,難以實現(xiàn),且效果不佳,對于漢語句子收稿日期:2007-05-14;修回日期:2007-06-10基金

6、項目:國家自然科學基金資助項目(60572100,60673122);深圳大學科研啟動基金資助項目(200747)作者簡介:梁正平(1979-),男(漢族),湖南省漣源市人,深圳大學講師、博士.E-mail:liangzp@szu.edu.en通訊作者:紀震(1973-),男(漢族),深圳大學教授、博士.E-mail:jizhen@szu.edu.en282深圳大學學報理工版第24卷的問題分析更是如此.HaoT等[臼]在問題分析中提為便于分析,可將語義模板分為超類層和子類層.出采用語義模板的方法,對提問語句進行分解.在在超類中又有實體、數(shù)字和描述等分類概念.超類使用過

7、程中,用戶只需在模板的特定位置輸入關鍵中的每一個概念都有一個或多個子類.例如,對于詞即可構(gòu)成實際問題.由于語義模板中各個成分之"數(shù)字",有時間、距離、速度和面積等子類實體.間的關系在模板定義時已明確,故易對提問語句進如果把超類中的概念作為一個根結(jié)點"模板"的子行分析和重構(gòu),從而便于在問題/答案庫中尋找相結(jié)點,則整個模板庫結(jié)構(gòu)上為一棵以"模板"為根同或相近的問題,并找到相關答案.文獻[13]僅結(jié)點的3層樹.其中,所有葉結(jié)點構(gòu)成整個模板簡單介紹了語義模板的定義及其在分析英文問句時庫.在添加模板時要先找到模板對應的超類和子的用途,這里則將其推廣到中文問句的

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。