資源描述:
《翻譯記憶系統(tǒng)關(guān)鍵技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、中國(guó)科學(xué)技術(shù)信息研究所碩士學(xué)位論文翻譯記憶系統(tǒng)關(guān)鍵技術(shù)研究姓名:董桂申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):情報(bào)學(xué)指導(dǎo)教師:王惠臨2011-05翻譯記憶系統(tǒng)關(guān)鍵技術(shù)研究摘要翻譯記憶(TranslationMemory)作為一種計(jì)算機(jī)輔助翻譯技術(shù),經(jīng)過三十多年的發(fā)展在理論和應(yīng)用上已逐漸成熟。翻譯記憶系統(tǒng)在全世界多種語(yǔ)言的翻譯中得到應(yīng)用,顯示了良好的輔助翻譯效果。國(guó)外關(guān)于翻譯記憶技術(shù)的研究主要集中于翻譯記憶檢索匹配算法的研究,將翻譯記憶與機(jī)器翻譯、寫作系統(tǒng)相結(jié)合應(yīng)用的研究;國(guó)內(nèi)則更多是關(guān)于翻譯記憶系統(tǒng)的使用介紹。本論文試圖從理論和實(shí)踐兩個(gè)方面討論翻譯記憶系統(tǒng)技術(shù),主要研
2、究?jī)?nèi)容如下:第一,在對(duì)翻譯記憶歷史現(xiàn)狀進(jìn)行深入分析的基礎(chǔ)上提出了第二代翻譯記憶的基本概念,即數(shù)據(jù)加結(jié)構(gòu)雙層匹配的原則,并就相應(yīng)的相似匹配算法和翻譯記憶的庫(kù)存結(jié)構(gòu)進(jìn)行了深入研究。利用基本的編輯距離計(jì)算方法進(jìn)行多層次的相似度計(jì)算,實(shí)現(xiàn)了詞匯、詞性、句法層級(jí)上的多層次匹配;以TMX和TBX兩個(gè)關(guān)鍵標(biāo)準(zhǔn)為基礎(chǔ),構(gòu)建了具有語(yǔ)句結(jié)構(gòu)信息的庫(kù)存結(jié)構(gòu)。第二,基于所設(shè)計(jì)的翻譯記憶庫(kù)存結(jié)構(gòu)和改進(jìn)的相似匹配算法設(shè)計(jì)實(shí)現(xiàn)了一個(gè)試驗(yàn)性的第二代翻譯記憶系統(tǒng),在數(shù)據(jù)庫(kù)中上利用改進(jìn)的相似匹配算法進(jìn)行了翻譯記憶實(shí)驗(yàn)。最后以英語(yǔ)為源語(yǔ)言、漢語(yǔ)為目標(biāo)語(yǔ)言,選擇一定規(guī)模的語(yǔ)料對(duì)系統(tǒng)進(jìn)行測(cè)試
3、,并與具有代表性的開源和商用翻譯記憶系統(tǒng)的輸出結(jié)果進(jìn)行對(duì)照評(píng)價(jià),以探討改進(jìn)的翻譯記憶庫(kù)存結(jié)構(gòu)和相似性算法的可行性。圖30幅,表9個(gè),參考文獻(xiàn)39篇,其中英文參考文獻(xiàn)24篇。關(guān)鍵詞:翻譯記憶;翻譯記憶存儲(chǔ)結(jié)構(gòu);相似度計(jì)算;計(jì)算機(jī)輔助翻譯;翻譯記憶標(biāo)準(zhǔn)分類號(hào):TP391,H085VResearchonKeyTechnologiesofTranslationMemorySystemAbstractAsonekindofcomputerassistedtechnology,TranslationMemorybecomesmorematureinthetheo
4、ryandapplicationduringlastthirtyyearsofdevelopment.Translationmemorysystemhasbeenappliedtothetranslationofmultilingualcorpus,showinggoodfunctioninassistingtranslation.Overseasresearchworkontranslationmemorytechnologyfocusesonthematchingretrievalalgorithmintranslationmemorysyste
5、m,theintegrationoftranslationmemorytechnologyandothermachinetranslationsystems,andstudyingtheauthoringsystem.DomesticstudyonTranslationMemoryshowsmuchlessportionoftheoryresearchthantheutilityintroductionoftranslationmemorysystem.Thispaperattemptstodiscussthetheoreticalandpracti
6、calaspectsofkeytranslationmemorytechnologyfromtwoaspects.Firstly,basedonin-depthanalysisofthedevelopmentandcurrentstatusoftranslationmemory,thethesisproposestheprincipalconceptofthesecondgenerationtranslationmemory,whichmatchesondouble-layerstructurebeyondthedata.Accordingly,it
7、focusesoncorrespondingsimilaritymatchingalgorithmandthestoragestructureofthesecondgenerationtranslationmemory.Astosimilaritymatchingalgorithm,itutilizesedit-distancebasedmethodformulti-levelsimilaritycomputation,toachievematchingonthevocabulary,partofspeech,syntactic.Astostorag
8、estructure,itisconstructedbasedonTMXandTBXtostorecorpu