資源描述:
《中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第34卷第5期自動化學(xué)報Vol.34,No.52008年5月ACTAAUTOMATICASINICAMay,2008中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測王博1楊沐昀1李生1趙鐵軍1摘要獨(dú)立的詞義消歧模型性能已經(jīng)獲得很大提高,但是對于獨(dú)立消歧模型在機(jī)器翻譯系統(tǒng)中應(yīng)用的必要性和作用一直存在著不同的觀點(diǎn).為了從更為一般性的角度評價這個問題,本文突破了具體模型的限制,通過在不同類型漢英機(jī)器翻譯系統(tǒng)中引入不受特定條件約束的高精度全詞消歧過程,對詞義消歧在機(jī)器翻譯系統(tǒng)中的影響進(jìn)行了較為充分和全面的評價.實(shí)驗(yàn)結(jié)果證明詞義消歧模型不僅本身具有一定的翻譯能力,而且可以提高不同類型的機(jī)器翻譯系統(tǒng)的整體性能.同時
2、也說明當(dāng)前的翻譯系統(tǒng)在消歧能力上還有較大的提升空間.關(guān)鍵詞詞義消歧,機(jī)器翻譯,全詞中圖分類號TP391EvaluationofAll-wordsWSDforChineseinMachineTranslation1111WANGBoYANGMu-YunLIShengZHAOTie-JunAbstractAlthoughremarkableimprovementshavebeenseenintheindependentwordsensedisambiguation(WSD)models,therearestilldebatesaboutthenecessitytointegratetheWSDmo
3、delswiththemachinetranslation(MT)systems.Tosettlethequestioninageneralview,webreaktherestrictionsfromspeciˉcmodelsandasimulativeperfectall-wordsWSDprocessisimportedintoMTsystemsofdi?erenttypestoacquireasu±cientandgeneralevaluation.ExperimentresultsindicatethataˉneWSDprocessnotonlyyieldsconsiderablet
4、ranslationqualityitselfbutalsoobviouslyimprovestheMTsystems.Inaddition,thisworkalsorevealsthatcurrentMTtechnologiesstillhavemuchroomtoimproveinselectingthebesttranslation.KeywordsWordsensedisambiguation,machinetranslation(MT),all-words詞義消歧(Wordsensedisambiguation,WSD)的性能已經(jīng)獲得提高的情況下,接下來受到關(guān)注的的主要任務(wù)是在上下文
5、中判斷詞匯的正確詞義.經(jīng)問題是WSD是否可以引入實(shí)際應(yīng)用?對這個問題過多年的發(fā)展,尤其在2000年英語詞義消歧系統(tǒng)開的研究目前還處于起步階段.在各種自然語言處理發(fā),測試和評價語料
6、Senseval的出現(xiàn)之后,WSD(Naturallanguageprocess,NLP)應(yīng)用中,MT作的研究取得了快速發(fā)展,目前無論是英語詞義消歧為WSD的一個主要應(yīng)用領(lǐng)域,是檢驗(yàn)WSD在實(shí)還是起步較晚的漢語詞義消歧都逐漸成為研究熱點(diǎn),際應(yīng)用中的性能的一個重要對象.對于WSD是否并已經(jīng)形成一些較為成熟的模型,其中既有基于規(guī)有助于提高M(jìn)T系統(tǒng)的性能這一問題的研究尚不多則的方法,也有基于統(tǒng)計的方法.在基于統(tǒng)計的方見.為
7、了驗(yàn)證WSD對MT的影響,在近期的工作法中,又可分為有指導(dǎo)的方法和無指導(dǎo)的方法,各種中,WuDK[2]首先將WSD應(yīng)用于統(tǒng)計機(jī)器翻譯方法在知識獲取、精度、規(guī)模等方面各有優(yōu)劣,但是(Statisticalmachinetranslation,SMT)系統(tǒng),結(jié)果總體來講詞義消歧模型的性能已經(jīng)達(dá)到了一定高度.顯示W(wǎng)SD的引入反而降低了SMT系統(tǒng)的整體性以漢語詞義消歧為例,魯松在2002年使用無指導(dǎo)方能,隨后Cabezas[3]在其工作中采取了不同的策略,法獲得的平均消歧精度已達(dá)到83.13%[1],而有指導(dǎo)結(jié)果使得引入了WSD的SMT系統(tǒng)的性能獲得了的方法的精度還會更高.少許的提升.二人的工作都對如
8、何將WSD模型引另一方面,詞義消歧往往被視為一個中間任務(wù),入MT系統(tǒng)作了有益的嘗試,并且驗(yàn)證了當(dāng)前WSD最終要服務(wù)于諸如機(jī)器翻譯(Machinetranslation,模型對MT系統(tǒng)可能產(chǎn)生的影響.從他們的工作中MT)、信息檢索等高級應(yīng)用.在獨(dú)立的WSD模型可以發(fā)現(xiàn),雖然WSD和MT系統(tǒng)都已經(jīng)具有較為成熟的方法,但是二者的有效結(jié)合卻仍存在著問題.收稿日期2006-12-21收修改稿日期2007-0