資源描述:
《語料庫標(biāo)注說明.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、“HSK動態(tài)作文語料庫”語料標(biāo)注及代碼說明“HSK動態(tài)作文語料庫”從字、詞、句、篇、標(biāo)點符號等角度,對所收入的作文語料中存在的外國人使用漢語的中介語偏誤進(jìn)行全面標(biāo)注。1、字處理(包括標(biāo)點符號)[C]:錯字標(biāo)記,用于標(biāo)示考生寫的不成字的字。用[C]代表錯字,在[C]前填寫正確的字。例如:地球[C](“球”是錯字)、這[C]。[B]:別字標(biāo)記,用于標(biāo)示把甲字寫成乙字的情況。別字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把別字移至[B]中B的后面,并在[B]前填寫正確的字。例如:提[B題]高、考慮[B虎]。[L]:漏字標(biāo)記,用于標(biāo)示作文中應(yīng)有而沒
2、有的字。用[L]表示漏掉的字,并在[L]前填寫所漏掉的字。例如:后悔[L],表示“悔”在原文中是漏掉的字。農(nóng)[L]藥,表示“農(nóng)”在原文中是漏掉的字。[D]:多字標(biāo)記,用于標(biāo)示作文中不應(yīng)出現(xiàn)而出現(xiàn)的字。把多余的字移至[D]中D的后面。例如:我的[D的],表示括號中的“的”是多余的字(原文中寫了兩個“的”)。[F]:繁體字標(biāo)記,用于標(biāo)示繁體字。把繁體字移至[F]中F的后面,并在[F]前填寫簡體字。例如:記憶[F憶]、單{F單}純、養(yǎng){F養(yǎng)}分{F份}。注意:1)繁體字標(biāo)記標(biāo)示的是使用正確的繁體字,如果該繁體字同時又是別字,則先標(biāo)繁體字標(biāo)記,再標(biāo)別字標(biāo)記。例如:儉樸
3、[F樸[B僕]]。2)繁體字寫錯了,標(biāo)為:后[F後[C]]。[Y]:異體字標(biāo)記,用于標(biāo)示異體字。把異體字移至[Y]中Y的后面,并在[Y]前填寫簡體字。例如:偏[Y徧]、沉[Y沈]。[P]:拼音字標(biāo)記,用于標(biāo)示以漢語拼音代替漢字的情況。把拼音字移至[P]中P的后面,并在[P]前填寫簡體字。例如:緣[Pyúan]分、保護(hù)[Phù]。[#]:無法識別的字的標(biāo)記,用于標(biāo)示無法識別的字。每個不可識別的字用一個[#]表示。例如:更[#][#]保存自己的生命,……[BC]:錯誤標(biāo)點標(biāo)記,用于標(biāo)示使用錯誤的標(biāo)點符號。把錯誤標(biāo)點移至[BC]中BC的后面,并在[BC]前填寫正確的
4、標(biāo)點符號。例如:勤奮、[BC,]刻苦的精神。[BQ]:空缺標(biāo)點標(biāo)記,用于標(biāo)示應(yīng)用標(biāo)點符號而未用的情況。把[BQ]插入空缺標(biāo)點之處,并在[BQ]中BQ的后面填寫所缺的標(biāo)點符號。例如:周圍的環(huán)境很安靜[BQ,]生活也非常平凡。[BD]:多余標(biāo)點標(biāo)記,用于標(biāo)示不應(yīng)用標(biāo)點符號而用了的情況。把多余的標(biāo)點移至[BD]中BD的后面。例如:我家周圍的[BD,]美麗風(fēng)景。2、詞處理:(包括成語){CC}:錯詞標(biāo)記,用于標(biāo)示錯誤的詞和成語。包括4種情況:1)把詞的構(gòu)成成分寫錯順序的。把寫錯的詞移至{CC}中CC的后面,并在{CC}前填寫正確的詞。例如:首先{CC先首}、眾所周知{
5、CC眾所知周}。2)該用甲詞而用乙詞的。這種情況類似別字,但屬于用詞層面上的錯誤。標(biāo)示方法同上。例如:雖然現(xiàn)在還沒有實現(xiàn){CC實踐},……它在{CC對}價格方面有點貴,所以沒得到廣大消費者的支持{CC持支}。3)生造詞。指考生自造的、或某些外語中可能有而漢語中不存在的詞。例如:農(nóng)作物{CC農(nóng)產(chǎn)物/農(nóng)物}、農(nóng)產(chǎn)品{CC農(nóng)作品}……但長期來看造成環(huán)境污染,破壞自然生態(tài){CC目態(tài)},……綠色食品的好處在于吃這些食品后在身體里沒有農(nóng)藥的殘留量{CC潛留量}。4)詞語搭配錯誤。包括詞性、音節(jié)等方面的搭配錯誤。例如:最好的辦法是兩個都保持{CC走去}平衡。我也回{CC1回
6、去}沈陽。吃這種東西會{CC1可以}得{CC1得到}病{CC1疾病}。{CLH}:離合詞錯誤標(biāo)記,用于標(biāo)示各種和離合詞相關(guān)的錯誤。標(biāo)在有錯誤的離合詞的后邊,表示前邊的離合詞用法有誤。例如:……我快要畢業(yè){CLH}大學(xué){CQ了}。雖然這么[L]多年都沒見面{CLH}過,…………我對哈爾濱{CJ-zy很}感興趣。有觀光{CLH}哈爾濱的宿愿。{W}:外文詞標(biāo)記,用于標(biāo)示以外文詞代替漢語詞的情況。把外文詞移至{W}中W的后面,并在{W}前填寫相應(yīng)的漢語詞。在W和外文詞之間填寫漢語詞的字?jǐn)?shù)。例如:非洲{W2Africa}、爵士樂{W3jazz}?!涛夜ぷ鞯姆椒▄W
7、2ABC}。{CQ}:缺詞標(biāo)記,用于標(biāo)示作文中應(yīng)有而沒有的詞。在缺詞之處加此標(biāo)記,并在{CQ}中CQ的后面填寫所缺的詞。例如:這就{CQ要}由有關(guān)部門和政策管理制度來控制?!械霓r(nóng)民{CQ在}不使用化肥和農(nóng)藥的情[B精]況下[BD,]養(yǎng)農(nóng)作物,……{CD}:多詞標(biāo)記,用于標(biāo)示作文中不應(yīng)有而有的詞。把多余的詞移至{CD}中CD的后面。例如:……然后肯德基的收入有所增加{CD了}。中國政府應(yīng)該采取良好的措施來管理農(nóng)業(yè){CD方面},……但我覺得{CD按照}上面所寫的方法是現(xiàn)在很多人或國家用的方法。詞處理中需要注意下列問題:1)因介詞、方位詞等的缺少或多余造成的結(jié)構(gòu)
8、不完整,助詞的錯用、多用、漏用,詞性誤