英漢機器翻譯中的介詞短語消歧

英漢機器翻譯中的介詞短語消歧

ID:33322299

大?。?70.62 KB

頁數(shù):54頁

時間:2019-02-24

英漢機器翻譯中的介詞短語消歧_第1頁
英漢機器翻譯中的介詞短語消歧_第2頁
英漢機器翻譯中的介詞短語消歧_第3頁
英漢機器翻譯中的介詞短語消歧_第4頁
英漢機器翻譯中的介詞短語消歧_第5頁
資源描述:

《英漢機器翻譯中的介詞短語消歧》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、對外經(jīng)濟貿(mào)易大學(xué)碩士學(xué)位論文英漢機器翻譯中的介詞短語消歧姓名:胡克力申請學(xué)位級別:碩士專業(yè):外國語言學(xué)與應(yīng)用語言學(xué)指導(dǎo)教師:陳蘇東;武姜生20040401中文摘要機器翻譯是自然語言處理中的一個極為重要的領(lǐng)域和試驗田。自然語言的多種因素也阻礙了機器翻譯的發(fā)展,比如一詞多義,句法歧義,復(fù)雜的多重語法結(jié)構(gòu)等等。在這些困難當中,歧義是最主要的因素。本文集中討論了英漢機器翻譯中,對介詞短語的句法歧義現(xiàn)象的消歧方法。在對主要機器翻譯系統(tǒng)的分類進行了簡要介紹之后,本文回顧了目前用于句法分析的最重要的一種形式語法:短語結(jié)構(gòu)語法,并演示了使用短語結(jié)構(gòu)語法分析句子結(jié)構(gòu)從而

2、導(dǎo)致介詞短語歧義結(jié)構(gòu)的過程。此后,本文主要分析了基于優(yōu)選的介詞短語消歧策略,并提出了一個實驗性的介詞短語消歧模型。針對模型中自動獲取短語搭配的需要,結(jié)合Brill錯誤驅(qū)動算法,通過重復(fù)該算法的實驗和數(shù)據(jù),驗證了運用該算法進行介詞短語消歧的有效性。最后,針對處理介詞短語歧義時遇到的數(shù)據(jù)稀疏這一所有統(tǒng)計語言模型都面臨的難題,分析介紹了基于N—Gram的回退法介詞短語消歧及平滑技術(shù)。關(guān)鍵詞:機器翻譯,介詞短語岐義,短語結(jié)構(gòu)語法,錯誤套《的機器學(xué)習(xí),數(shù)據(jù)稀疏AbstractMachinetranslation(MT)isanextremelyimportant

3、researchfieldandtest-inggroundofnaturallangllageprocessing(NLP).Asaninterdisciplinaryresearchfield,MTrequirestheknowledgeofLinguistics,ComputerSdence,Mathmaticsetc.,whichremainsachallenginga,rea.ManyfactorshinderthedevelopmentofMT,suchaslexiealambiguity,syntacticambiguity,multip

4、legrammaticalstructuresetc.,amongwhichvariouskindsofambiguityarethemostdifficultpart.Thisthesisfocusesondlsambiguationofprepositionalphrase(PP)at-tachment.AfterabriefintroductiontotheclassificationofmajorMTsys—tems,thisthesisreviewsoilthemostimportantformalgrammarinMT:PSGlanddem

5、onstratedhowprepositionalphraseattachmentambiguityisderivedwhenparsingbythisgrammar.Afterthat,theauthormainlyann-lyzespreference—baseddisambiguationapproachesandproposesatentativemodelforresolvingPPambi£;uity.Facingthemajorproblemoflackingofrules,thisthesisverifiesBrill’stransfo

6、rm—basederror-drivenalgorithmandexperimentforautomaticretrievaloftransformationrules.Finally,incon-nectionwiththesparsedataproblemintheprocessingofPPdisambiguationaudcurrentstatisticallanguagemodels,theauthorintroducesthebacked-offN—Grambasedalgorithmandsimilarity-basedsmoothing

7、.KeyWords:MachineTranslation,PrepositionalPhraseAttachmentProblemlPhraseStructureGraalamar】Error-drivenLearning,SparseDataAcknowledgements1wouldliketoexpressmygratitudetothefollowingpeoplefortheirsupportandassistallceinthewritingofthisthesis:MygratitudegoestoprofessorChenSudong,

8、thebestacademicadvisorandteacherIcouldhavewishe

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。