漢蒙藏維語(yǔ)言翻譯方法研究

漢蒙藏維語(yǔ)言翻譯方法研究

ID:8398879

大小:97.00 KB

頁(yè)數(shù):6頁(yè)

時(shí)間:2018-03-26

漢蒙藏維語(yǔ)言翻譯方法研究_第1頁(yè)
漢蒙藏維語(yǔ)言翻譯方法研究_第2頁(yè)
漢蒙藏維語(yǔ)言翻譯方法研究_第3頁(yè)
漢蒙藏維語(yǔ)言翻譯方法研究_第4頁(yè)
漢蒙藏維語(yǔ)言翻譯方法研究_第5頁(yè)
資源描述:

《漢蒙藏維語(yǔ)言翻譯方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。

1、漢、藏、蒙、維多民族語(yǔ)言語(yǔ)音翻譯方法研究解國(guó)棟曹文潔宗成慶徐波中國(guó)科學(xué)院自動(dòng)化所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100080,中國(guó)E-mail:{gdxie,caowj,cqzong,xubo}@nlpr.ia.ac.cnTel:+86-10-82614468摘要漢語(yǔ)與少數(shù)民族語(yǔ)言之間機(jī)器翻譯的研究對(duì)于促進(jìn)少數(shù)民族地區(qū)經(jīng)濟(jì)文化發(fā)展具有很重要的意義,目前這方面可投入的人力物力是十分有限的。對(duì)于漢、藏、蒙、維語(yǔ)言之間互譯來(lái)說(shuō),基于中間語(yǔ)言的翻譯方法,是一種經(jīng)濟(jì)有效的途徑。本文介紹了一種基于中間語(yǔ)義表示(IF)實(shí)現(xiàn)漢、藏、蒙、維多語(yǔ)言語(yǔ)音翻譯的基本思想,并介紹了面向IF的魯棒的漢語(yǔ)口語(yǔ)解析方法以及基

2、于IF的漢語(yǔ)英語(yǔ)生成方法。關(guān)鍵詞:少數(shù)民族語(yǔ)言,中間語(yǔ)言,IF,解析,生成1.引言我國(guó)有56個(gè)民族,大多數(shù)的民族都有自己獨(dú)特的語(yǔ)言。隨著社會(huì)的發(fā)展,各民族之間的經(jīng)濟(jì)文化交流越來(lái)越頻繁,在此過(guò)程中,語(yǔ)言的差異是一個(gè)客觀現(xiàn)實(shí),由此帶來(lái)的相關(guān)問(wèn)題,是制約少數(shù)民族地區(qū)經(jīng)濟(jì)文化發(fā)展一個(gè)重要因素,因此,有必要進(jìn)行少數(shù)民族語(yǔ)言與漢語(yǔ)之間的多語(yǔ)言機(jī)器翻譯研究,這對(duì)促進(jìn)少數(shù)民族地區(qū)經(jīng)濟(jì)發(fā)展、促進(jìn)各民族之間文化交流以及民族團(tuán)結(jié)都具有重大的意義。另外,各個(gè)少數(shù)民族都有自己獨(dú)有的風(fēng)俗文化,對(duì)這些風(fēng)俗文化進(jìn)行研究、保護(hù)和開(kāi)發(fā),無(wú)論從社會(huì)還是經(jīng)濟(jì)上,都有著深遠(yuǎn)的意義,而語(yǔ)言是這些風(fēng)俗文化最直接的載體,這也對(duì)語(yǔ)言翻譯提

3、出了要求。目前,少數(shù)民族語(yǔ)言的機(jī)器翻譯研究,雖然取得了一定的成績(jī),但是,由于經(jīng)濟(jì)、文化、資源、歷史等眾多的原因,還停留在起步階段,很多問(wèn)題都有待進(jìn)一步研究[12]。少數(shù)民族中,藏族、蒙古族和維吾爾族各自擁有本民族的語(yǔ)言,在自然語(yǔ)言處理方面的研究起步也比較早,有了一定的基礎(chǔ),而且這三個(gè)民族地區(qū)人口比較多,因此,有必要把漢、藏、蒙、維語(yǔ)言之間的機(jī)器翻譯研究作為當(dāng)前的少數(shù)民族語(yǔ)言機(jī)器翻譯研究的一個(gè)主要任務(wù)。目前蒙古文機(jī)器翻譯系統(tǒng)有王斯日古楞等人研制的英蒙機(jī)器翻譯(EnglishMongolianMachineTranslation,簡(jiǎn)稱EMMT)系統(tǒng),內(nèi)蒙古大學(xué)那順烏日?qǐng)D等研制的漢蒙機(jī)器翻譯系統(tǒng)

4、,這兩個(gè)系統(tǒng)目前都尚處于研究階段[12]。藏語(yǔ)的計(jì)算機(jī)處理目前的研究重點(diǎn)大致包括藏文編碼標(biāo)準(zhǔn)及平臺(tái)建設(shè)、藏語(yǔ)語(yǔ)法研究、分詞標(biāo)準(zhǔn)、電子詞典建設(shè)等階段,也有一些機(jī)器翻譯系統(tǒng)[15]。關(guān)于維吾爾族語(yǔ)的計(jì)算機(jī)處理方面研究也主要集中在維吾爾語(yǔ)的編碼標(biāo)準(zhǔn)及平臺(tái)建設(shè)方面。在諸多的機(jī)器翻譯實(shí)現(xiàn)方法中,有一種基于中間語(yǔ)言的方法,這種方法利用一種人工制定的標(biāo)準(zhǔn)語(yǔ)言作為語(yǔ)言翻譯的中介,即首先把源語(yǔ)言解析為中間語(yǔ)言的表示形式,然后再由這種中間語(yǔ)言生成目標(biāo)語(yǔ)言。對(duì)于一個(gè)多語(yǔ)言翻譯系統(tǒng),如果采用轉(zhuǎn)換的方法,則不同方向的翻譯需要不同的翻譯模塊,比如英譯漢和漢譯英分別需要一個(gè)翻譯模塊。假設(shè)有N種語(yǔ)言需要進(jìn)行互譯,總共則需

5、要N*(N-1)個(gè)翻譯模塊,而采用中間語(yǔ)言的方法,由于對(duì)每一種語(yǔ)言只需實(shí)現(xiàn)將該種語(yǔ)言翻譯成中間語(yǔ)言和把中間語(yǔ)言翻譯成該種語(yǔ)言這兩個(gè)模塊,對(duì)于N種語(yǔ)言之間的互譯,總共只需要2N個(gè)翻譯模塊,這一過(guò)程如圖1所示,因此,采用基于中間語(yǔ)言的翻譯方法進(jìn)行多語(yǔ)言的互譯,能夠降低系統(tǒng)的復(fù)雜性,是一種經(jīng)濟(jì)有效的途徑。非基于中間語(yǔ)言的方法,包括基于規(guī)則的轉(zhuǎn)換方法和基于語(yǔ)料庫(kù)的統(tǒng)計(jì)方法?;谝?guī)則的方法,首先需要對(duì)源語(yǔ)言進(jìn)行分析,然后根據(jù)目標(biāo)語(yǔ)言的特點(diǎn),把分析結(jié)果轉(zhuǎn)換成目標(biāo)語(yǔ)言。這一過(guò)程中,除了要對(duì)源語(yǔ)言進(jìn)行各方面的研究外,還要對(duì)目標(biāo)語(yǔ)言進(jìn)行研究,需要懂源語(yǔ)言和目標(biāo)語(yǔ)言的專業(yè)人員編寫(xiě)大量的規(guī)則和建立詞典。而基于語(yǔ)

6、料庫(kù)的統(tǒng)計(jì)方法,則首先需要收集大量的雙語(yǔ)語(yǔ)料,即一句源語(yǔ)言對(duì)應(yīng)一句目標(biāo)語(yǔ)言,然后對(duì)雙語(yǔ)語(yǔ)料進(jìn)行對(duì)齊,在此基礎(chǔ)之上,進(jìn)行統(tǒng)計(jì)模型的訓(xùn)練??傊?,無(wú)論是基于規(guī)則的轉(zhuǎn)換方法還是基于語(yǔ)料庫(kù)的統(tǒng)計(jì)方法,都需要投入比較多的人力和物力,而少數(shù)民族語(yǔ)言的機(jī)器翻譯研究,受到各種條件的限制,可投入的資源特別是人力是很有限的,因此,采用中間語(yǔ)言作為中介進(jìn)行翻譯,每個(gè)民族只需負(fù)責(zé)把本民族語(yǔ)言轉(zhuǎn)換為中間語(yǔ)言和把中間語(yǔ)言產(chǎn)轉(zhuǎn)換為本民族語(yǔ)言,就可以實(shí)現(xiàn)本民族語(yǔ)言和其他語(yǔ)言的互譯,這在一定程度上,能夠節(jié)省人力和物力,不失為一種可行的途徑。語(yǔ)言1語(yǔ)言3語(yǔ)言4語(yǔ)言2語(yǔ)言1語(yǔ)言3語(yǔ)言4語(yǔ)言2中間語(yǔ)言a.基于轉(zhuǎn)換的方法b.基于中間

7、語(yǔ)言的方法圖1轉(zhuǎn)換方法和中間語(yǔ)言方法所需不同翻譯模塊的比較早期的中間語(yǔ)言主要有法國(guó)的CETA實(shí)驗(yàn)室的“樞軸語(yǔ)言”(pivotlanguage),該中心利用它進(jìn)行了數(shù)學(xué)、物理文獻(xiàn)方面的俄-法翻譯系統(tǒng)[16],2000年日本聯(lián)合國(guó)大學(xué)的Uchida提出了一種UNL(UniversalNetworkLanguage)語(yǔ)言[19],用來(lái)進(jìn)行多種語(yǔ)言的翻譯。成立于1990年的成立C-STAR(ConsortiumofSpeechT

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。