旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例

旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例

ID:9130319

大?。?1.50 KB

頁數(shù):5頁

時間:2018-04-18

旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例_第1頁
旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例_第2頁
旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例_第3頁
旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例_第4頁
旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例_第5頁
資源描述:

《旅游翻譯語料庫的構(gòu)建及應用——以浙江省旅游文化漢英翻譯平行語料庫為例》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫

1、旅游翻譯語料庫的構(gòu)建及應用一一以浙江省旅游文化漢英翻譯平行語料庫為例雜中國計量大學外國語學院本文從語料庫的設計、語料的選取與采集、語料整理、優(yōu)化搜索、后期維護等方而,深入探討了浙江省旅游文化漢英翻譯平行語料庫的構(gòu)建,并從旅游文本翻譯、翻譯教學和翻譯實踐三方面,分析了浙江省旅游文化翻譯平行語料庫的應用。關(guān)鍵詞:旅游翻譯;語料庫;構(gòu)建;應用;研宄方向:語言學及應用語言學、翻譯學等?;穑?015年浙江省旅游科學研究項目(項目編號:2015YB04)21世紀翻譯研究領域的一大進展就是語料庫翻譯學范式的建立、研宄和發(fā)展。當前,語料庫以一種前所未有的技術(shù)呈現(xiàn)語言運用事實,成為一種真實可靠的資源及信息檢

2、索和處理平臺,為研宄者提供了大量真實的語言數(shù)據(jù)庫,使語言分析研究能夠基于自然發(fā)生的語言結(jié)構(gòu)和形式,而不是靠自覺感知的語言現(xiàn)象展幵。棊于語料庫的旅游文本翻譯的最大優(yōu)勢在于從語言現(xiàn)象入手,使用真實的旅游語料描述語言特征,通過大量語料從縱向找尋重復出現(xiàn)的語言形式,更加客觀準確地揭示木質(zhì),提高對語言系統(tǒng)的洞察力,從而為翻譯實踐服務。一、浙江省旅游文化漢英翻譯平行語料庫的構(gòu)建為直觀地研究浙江省旅游文本的翻譯現(xiàn)象,筆者研制丫一個小型語料庫一一浙江省旅游文化漢英翻譯平行語料庫,容量約15~20萬詞,主要為翻譯研宄、翻譯教學和翻譯實踐。(一)語料庫設計此語料庫的設計基于書面文木和口語副木兩方面。這種設計理念

3、是基于當代語料庫研宄領域的兩種不同觀點:一種認為在某些特定方面,u語形態(tài)的文本更能反映出翻譯最基本的組織形式;另一種更傾向于文本的翻譯模式。在構(gòu)建浙江省旅游文本語料庫時,筆者將兩種不同模式的文本融合在一起,從而增強了語料庫的多樣性,更加符合翻譯需求。運用語料庫專業(yè)軟件AntCom作為語料建設平臺,將所有搜集和整理好的語料原始文件批量轉(zhuǎn)換和輸入到AntCont中。為更好地管理和搜索源文件,所有的文件將以“城市+旅游景點+日期”的格式儲存在系統(tǒng)屮。例如,“西湖十景”是以“杭州+平湖秋月+2017”的格式儲存十個景點的翻譯語料。(二)語料的選取與釆集因語料的收集范圍直接影響語料的質(zhì)量,因此,木文釆

4、用以下幾個標準來確定語料收集的范圍,以保證語料的代表性、平衡性和權(quán)威性。第一,語料內(nèi)容為與浙江省相關(guān)的旅游文化材料。為保證語料的權(quán)威性和代表性,本文選取了浙江省4A和5A級旅游景區(qū)的資料作為建庫語料,且以擁有有效中英文網(wǎng)頁鏈接的旅游景區(qū)內(nèi)容介紹為主耍選擇,包括景點介紹和推廣材料、宣傳文化傳統(tǒng)和習俗的資料等中英文雙語語料。此外,在選取過程中還應側(cè)重語料的可比性和多樣性,如關(guān)于三潭印月的翻譯文本,該語料搜集了來自不同吋期、不冋出版物,甚至來自不同英語國家共八項翻譯素材。第二,正式出版或非正式出版的語料分別入庫。正式出版物如書籍、雜志、音像資料等,非正式出版物如介紹旅游文化景點的網(wǎng)頁、各類旅游文化

5、宣傳資料,包括灑店介紹、旅行社傳單、景點公示牌上的中英文介紹、旅游公示語等。第三,語料載體不限。選取的語料可以是書籍、雜志、網(wǎng)頁、旅游小冊子,包括旅游景觀介紹、旅游廣告、景點屮英文招牌、民俗風情介紹、飲食文化介紹、人名地名介紹、歷史文化介紹、物產(chǎn)資源等。(三)語料整理收集相應的語料后,對釆集的原始語料進行了初步整理和歸類,紙制材料需經(jīng)過掃描統(tǒng)一轉(zhuǎn)為Word格式。語料的切分采用人工切分對齊和軟件切分對齊的方法,軟件采用英文自動分句工具Multiconcord進行自動分句對齊處理。屮英文由于句式、結(jié)構(gòu)、標點符號及語篇的差異,在實際翻譯中無法以句子為單位進行一對一翻譯,目前軟件所能完成的自動句子對

6、齊處理只占50%~60%,其余仍須手工對齊和切分。為統(tǒng)一標準,該語料庫按照以句子為單位進行切分和對齊的原則,即無論是一句原文對應一句譯文,還是一句原文對應數(shù)句譯文,都按照一句處理,具體來說,簡短的公示語按照句子切分和對齊,人名、地名、旅游景點名稱、旅游設施、旅游活動等的翻譯按照詞組對齊的方法處理。所有資料都需經(jīng)過清潔標注后方可入庫,且對入庫的中英文語料分別存放,以避免中英文混排而出現(xiàn)亂碼現(xiàn)象。(四)標注對采集的全部翻譯語料和素材進行標注和細分是語料庫設計和開發(fā)中必不可少的一步。在語料庫中,主要對文本頭和詞性進行標注,如譯者國籍、發(fā)表吋間、性別、語料出處、關(guān)鍵詞等。另外,制定標注規(guī)范,抽取部分

7、典型漢英對應語料進行錯誤標注和分類,并標注賦碼與流程,實施嚴格的標注質(zhì)量監(jiān)控。(五)優(yōu)化搜索設計和運用一些必要的通配符可以一定程度上提升語料庫的運用效果。比如,英文大小寫和“*”符號的運用。在英文翻譯實際練習中,介詞的運用十分頻繁。例如,在疑問but是否可以放句首時,將第一個字母B大寫,從而使用設計好的語料庫來搜索文本資料,并基于搜索到的文本資料分析和判斷but的用法。符號在語料庫軟件中是一個通配符,如“We

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。