機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略

機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略

ID:18605134

大?。?12.00 KB

頁數(shù):11頁

時間:2018-09-19

機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略_第1頁
機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略_第2頁
機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略_第3頁
機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略_第4頁
機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略_第5頁
資源描述:

《機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。

1、第七屆中國人工智能聯(lián)合學術會議(2002,桂林)Page11of11機器翻譯中基于語法、語義知識庫的漢語詞義消歧策略§本項研究得到國家973項目“面向新聞領域的漢英機器翻譯系統(tǒng)”(項目號:G1998030507-4)的支持。王惠北京大學計算語言學研究所,北京,100871摘要:詞義消歧研究在自然語言處理的許多應用領域中具有重要的理論和實踐意義,在機器翻譯中更是如此,它直接關系到譯文質量的提高。但目前已有的詞義消歧系統(tǒng)基本上都面臨著消歧知識獲取的瓶頸問題。本文認為,要真正有效地提高詞義知識庫的質量,需要在詞類劃分基礎上,增加詞義的語法功能分析和語義搭配限制,綜合利用現(xiàn)有的語法、語義

2、資源,提取多義詞的每個意義在不同層級上的各種分布特征。以此為基礎,本文提出了一種漢英機器翻譯系統(tǒng)中基于語法、語義知識庫的漢語詞義消歧分析算法。初步的實驗結果表明,該方法可以高質量地進行漢語名詞、動詞、形容詞的詞義消歧。關鍵詞:詞義消歧(WSD)漢英機器翻譯語法詞典語義詞典AStudyofChineseWordSenseDisambiguationinMTBasedonGrammatical&SemanticKnowledge-basesWang,Hui(InstituteofComputationalLinguistics,PekingUniversity,Beijing1008

3、71,China)AbstractWordsensedisambiguation(WSD)playsanimportantroleinMachineTranslationandmanyotherareasofnaturallanguageprocessing.TheresearchonWSDhasgreattheoreticalandpracticalsignificance.ThemainworkinthispaperistostudywhatkindofknowledgeisusefulforWSDinsystem,andestablishamulti-levelWSDmod

4、elbasedonsyntagmaticfeaturesandsemanticinformation,whichcanbeusedtodisambiguatewordsenseinMandarinChineseeffectively.ThemodelmakesfulluseoftheGrammaticalKnowledge-baseofContemporaryChineseasoneofitsmainmachine-readabledictionary(MRD),whichcanproviderichgrammaticalinformationfordisambiguations

5、uchasChineselexicon,parts-of-speech(POS)andsyntaxfunction.AnotherresourceofthemodelistheSemanticDictionaryofContemporaryChinese,whichprovidesathesaurusandsemanticcollocationinformationof68,000Chinesewords.TheresultsofthisstudyindicatethatthetwoMRDresourcesareeffectiveforwordsensedisambiguatio

6、ninMTandarelikelytobeimportantforgeneralChineseNLP.Keywords:WordSenseDisambiguation,Chinese-EnglishMachineTranslation,GrammaticalKnowledge,SemanticDictionary第七屆中國人工智能聯(lián)合學術會議(2002,桂林)Page11of111.引言由于自然語言中一詞多義現(xiàn)象普遍存在,在機器翻譯中,要讓計算機進行準確的譯文選擇(translationchoice),一個重要的前提條件就是能夠在某個特定上下文中,自動排除歧義,確定多義詞的詞義。

7、因此,詞義消歧(Wordsensedisambiguation,WSD)從50年代初期開始機器翻譯研究起就一直備受計算語言學家的關注[1,2]。早期人們所使用的詞義消歧知識一般是憑人手工編制的規(guī)則。由于手工編寫規(guī)則費時費力,存在嚴重的知識獲取的“瓶頸”問題。20世紀80年代以后,語言學家提供的各類詞典成為人們獲取詞義消歧知識的一個重要知識源。Lesk、Luk根據(jù)《OxfordAdvancedLearner’sDictionary》中的釋義文本來判斷多義詞在上下文中的詞義[3,4]

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。