中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf

中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf

ID:52289356

大?。?29.31 KB

頁數(shù):7頁

時間:2020-03-26

中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf_第1頁
中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf_第2頁
中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf_第3頁
中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf_第4頁
中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf_第5頁
資源描述:

《中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、第34卷第5期自動化學(xué)報Vol.34,No.52008年5月ACTAAUTOMATICASINICAMay,2008中文全詞消歧在機(jī)器翻譯系統(tǒng)中的性能評測王博1楊沐昀1李生1趙鐵軍1摘要獨(dú)立的詞義消歧模型性能已經(jīng)獲得很大提高,但是對于獨(dú)立消歧模型在機(jī)器翻譯系統(tǒng)中應(yīng)用的必要性和作用一直存在著不同的觀點(diǎn).為了從更為一般性的角度評價這個問題,本文突破了具體模型的限制,通過在不同類型漢英機(jī)器翻譯系統(tǒng)中引入不受特定條件約束的高精度全詞消歧過程,對詞義消歧在機(jī)器翻譯系統(tǒng)中的影響進(jìn)行了較為充分和全面的評價.實(shí)驗(yàn)結(jié)果證明詞義消歧模型不僅本身具有一定的翻譯能力,而且可以提高不同類型的機(jī)器翻譯系統(tǒng)的整體性能.同時

2、也說明當(dāng)前的翻譯系統(tǒng)在消歧能力上還有較大的提升空間.關(guān)鍵詞詞義消歧,機(jī)器翻譯,全詞中圖分類號TP391EvaluationofAll-wordsWSDforChineseinMachineTranslation1111WANGBoYANGMu-YunLIShengZHAOTie-JunAbstractAlthoughremarkableimprovementshavebeenseenintheindependentwordsensedisambiguation(WSD)models,therearestilldebatesaboutthenecessitytointegratetheWSDmo

3、delswiththemachinetranslation(MT)systems.Tosettlethequestioninageneralview,webreaktherestrictionsfromspeciˉcmodelsandasimulativeperfectall-wordsWSDprocessisimportedintoMTsystemsofdi?erenttypestoacquireasu±cientandgeneralevaluation.ExperimentresultsindicatethataˉneWSDprocessnotonlyyieldsconsiderablet

4、ranslationqualityitselfbutalsoobviouslyimprovestheMTsystems.Inaddition,thisworkalsorevealsthatcurrentMTtechnologiesstillhavemuchroomtoimproveinselectingthebesttranslation.KeywordsWordsensedisambiguation,machinetranslation(MT),all-words詞義消歧(Wordsensedisambiguation,WSD)的性能已經(jīng)獲得提高的情況下,接下來受到關(guān)注的的主要任務(wù)是在上下文

5、中判斷詞匯的正確詞義.經(jīng)問題是WSD是否可以引入實(shí)際應(yīng)用?對這個問題過多年的發(fā)展,尤其在2000年英語詞義消歧系統(tǒng)開的研究目前還處于起步階段.在各種自然語言處理發(fā),測試和評價語料

6、Senseval的出現(xiàn)之后,WSD(Naturallanguageprocess,NLP)應(yīng)用中,MT作的研究取得了快速發(fā)展,目前無論是英語詞義消歧為WSD的一個主要應(yīng)用領(lǐng)域,是檢驗(yàn)WSD在實(shí)還是起步較晚的漢語詞義消歧都逐漸成為研究熱點(diǎn),際應(yīng)用中的性能的一個重要對象.對于WSD是否并已經(jīng)形成一些較為成熟的模型,其中既有基于規(guī)有助于提高M(jìn)T系統(tǒng)的性能這一問題的研究尚不多則的方法,也有基于統(tǒng)計的方法.在基于統(tǒng)計的方見.為

7、了驗(yàn)證WSD對MT的影響,在近期的工作法中,又可分為有指導(dǎo)的方法和無指導(dǎo)的方法,各種中,WuDK[2]首先將WSD應(yīng)用于統(tǒng)計機(jī)器翻譯方法在知識獲取、精度、規(guī)模等方面各有優(yōu)劣,但是(Statisticalmachinetranslation,SMT)系統(tǒng),結(jié)果總體來講詞義消歧模型的性能已經(jīng)達(dá)到了一定高度.顯示W(wǎng)SD的引入反而降低了SMT系統(tǒng)的整體性以漢語詞義消歧為例,魯松在2002年使用無指導(dǎo)方能,隨后Cabezas[3]在其工作中采取了不同的策略,法獲得的平均消歧精度已達(dá)到83.13%[1],而有指導(dǎo)結(jié)果使得引入了WSD的SMT系統(tǒng)的性能獲得了的方法的精度還會更高.少許的提升.二人的工作都對如

8、何將WSD模型引另一方面,詞義消歧往往被視為一個中間任務(wù),入MT系統(tǒng)作了有益的嘗試,并且驗(yàn)證了當(dāng)前WSD最終要服務(wù)于諸如機(jī)器翻譯(Machinetranslation,模型對MT系統(tǒng)可能產(chǎn)生的影響.從他們的工作中MT)、信息檢索等高級應(yīng)用.在獨(dú)立的WSD模型可以發(fā)現(xiàn),雖然WSD和MT系統(tǒng)都已經(jīng)具有較為成熟的方法,但是二者的有效結(jié)合卻仍存在著問題.收稿日期2006-12-21收修改稿日期2007-0

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。