數(shù)字媒體及應(yīng)用new

數(shù)字媒體及應(yīng)用new

ID:17858242

大?。?02.50 KB

頁數(shù):30頁

時間:2018-09-07

數(shù)字媒體及應(yīng)用new_第1頁
數(shù)字媒體及應(yīng)用new_第2頁
數(shù)字媒體及應(yīng)用new_第3頁
數(shù)字媒體及應(yīng)用new_第4頁
數(shù)字媒體及應(yīng)用new_第5頁
資源描述:

《數(shù)字媒體及應(yīng)用new》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、1、文本概述??文字:一種書面語言,由一系列稱為“字符”(character)的書寫符號構(gòu)成。??文本:文字信息在計算機中的表示形式,是基于特定字符集的、具有上下文相關(guān)性的一個(二進制編碼)字符流,是計算機中最常用的一種數(shù)字媒體。組成文本的基本元素是字符,字符在計算機中采用二進制編碼表示。2、文本處理??文本在計算機中的處理過程:文本的準備(如漢字的輸入)、文本編輯、文本處理、文本存儲與傳輸、文本展現(xiàn)等,根據(jù)應(yīng)用的不同,各個處理環(huán)節(jié)的內(nèi)容和要求可能有很大的差別。5.1.1文本的表示與字符的編碼?1、文本的表示??文本是計算機表示文字及符號信息的最常用也是最基本的一種數(shù)

2、字媒體。由于文字和符號采用了二進制編碼表示,因而可以方便地進行編輯、排版和各種分析處理(如統(tǒng)計、排序、分類、索引、檢索等)。2、西文字符集編碼?字符集:常用字符的集合。?西文字符集:由拉丁字母、數(shù)字、標點符號及一些特殊符號組成。?字符的編碼:字符集中每一個字符各有一個代碼,即字符的二進制表示,稱為該字符的編碼。(1)標準ASCII編碼字符集。??美國標準信息交換碼(AmericanStandardCodeforInformationInterchange):使用7個二進位對字符進行編碼(叫做標準ASCII碼),稱為ISO-646標準?;镜腁SCII字符集共有128個

3、字符,其中包括96個可打印字符(常用字母、數(shù)字、標點符號等),32個控制字符。常用的特殊字符的ASCII碼:空格(32)、A(65)、B(66)、…、Z(90)、a(97)、b(98)、…、z(122)、數(shù)字0(48)、1(49)、…、9(57)。??其編碼規(guī)則為:用7位二進制數(shù)對每一個字符進行編碼(字符的ASCII碼),在計算機內(nèi)部則用字符的ASCII碼存儲和表示該字符。在計算機中的存儲方法是:用一個字節(jié)(8位)來存儲一個字符的ASCII碼。每個字節(jié)中多出來的最高位一般保持為“0”。?(2)擴充ASCII編碼字符集。?標準ASCII字符集只有128個不同的字符,在很

4、多應(yīng)用中無法滿足要求。按照IS02022標準(《七位字符集的代碼擴充技術(shù)》)的規(guī)定,ISO陸續(xù)制定了一批適用于不同地區(qū)的擴充ASCII字符集,每個擴充ASCII字符集分別可以擴充128個字符,這些擴充字符的編碼均是高位為“1”的8位代碼(十進制數(shù)128~255),稱為擴展ASCII碼。3、漢字編碼字集(1)GB2312-80漢字編碼字符集。?《信息交換用漢字編碼字符集·基本集》(GB2312-80),其組成部分包括:?第一部分:字母、數(shù)字和各種符號,包括拉丁字母、俄文、日文平假名與片假名、希臘字母、漢語拼音等共682個(統(tǒng)稱為GB2312圖形符號)。?第二部分:一級常

5、用漢字,共3755個,按漢語拼音排列。?第三部分:二級常用字,共3008個,按偏旁部首排列。??①區(qū)位碼:GB2312國標字符集構(gòu)成一個二維平面,它分成94行、94列,行號稱為區(qū)號,列號稱為位號。每一個漢字或符號在碼表中都有各自的位置,字符的位置用它所在的區(qū)號(行號)及位號(列號)來表示。每個漢字的區(qū)號和位號分別用1個字節(jié)來表示。如:“大”字的區(qū)號20,位號83,區(qū)位碼是2083,用2個字節(jié)表示為:0001010001010011B(即十六進制1453H)。???②國標交換碼:將GB2312字符集中每個漢字的區(qū)號和位號必須分別加上32(即二進制0010?0000,十六

6、進制20H),就可以得到該漢字的“國標交換碼”(簡稱交換碼)。因此,“大”字的國標交換碼是:0011010001110011B(即十六進制3473H)。?③機內(nèi)碼:把一個漢字看作兩個擴展ASCII碼,使表示GB2312漢字的兩個字節(jié)的最高位(b7)都等于“1”。這種高位為1的雙字節(jié)(16位)漢字編碼就稱為GB2312漢字的“機內(nèi)碼”,又稱內(nèi)碼。即將漢字的區(qū)號和位號必須分別加上160(即二進制10100000,十六進制AOH),就可以得到該漢字的“機內(nèi)碼”。如:“大”字的機內(nèi)碼是:1011010011110011(即十六進制B4F3H)。?綜上所述,可以總結(jié)如下公式:國

7、標碼=區(qū)位碼+2020H,機內(nèi)碼=區(qū)位碼+A0A0H。???(2)GBK漢字編碼字符集。???GB2312-80只有6763個漢字,使用時功能不夠。1995年發(fā)布GBK,全稱為《漢字內(nèi)碼擴展規(guī)范》??GBK字符集中一共有21003個漢字和883個圖形符號,它與GB2312國標漢字字符集及其內(nèi)碼保持兼容。它除了包含GB2312中的全部漢字和符號,還包括繁體字和中、日、韓文字中的大量漢字。?GBK的編碼是用2字節(jié)編碼表示,第1字節(jié)的最高位必為“1”,第2字節(jié)的最高位不一定是“1”。與GB2312-80保持兼容。??(3)UCS/Unicode與GB180

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。