資源描述:
《漢字是如何編碼的.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、漢字是如何編碼的以奇渠存儲和單位011000018個位組成一個字節(jié)(Byte,縮寫位B)字節(jié)是存儲信息的基本單位1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB存儲一個漢字需要兩個字節(jié)。由于漢字有一萬多個,常用的也有六千多個,所以編碼采用兩字節(jié)的低7位共14個二進(jìn)制位來表示。一般漢字的編碼方案要解決4種編碼問題。位(bit)存儲信息的最小單位漢字的編碼——漢字交換碼漢字交換碼主要是用作漢字信息交換的。以國家標(biāo)準(zhǔn)局1980年頒布的《信息交換用漢字編碼字符集基本集》(代號GB2312-80)規(guī)定漢字交換碼作為國家標(biāo)
2、準(zhǔn)漢字編碼,簡稱國標(biāo)碼。國標(biāo)GB2312-80規(guī)定,所有的國際漢字和符號組成一個94*94的矩陣。在該矩陣中,每一行稱為一個“區(qū)”,每一列稱為一個“位”,這樣就形成了94個區(qū)號(01~94)和94個位號(01~94)的漢字字符集。國標(biāo)碼中有6763個漢字和628個其他基本圖形字符,共計7445個字符。其中規(guī)定一級漢字3755個,二級漢字3008個,圖形符號682個。一個漢字所在的區(qū)號與位號簡單地組合在一起就構(gòu)成了該漢字的“區(qū)位碼”。在漢字區(qū)位碼中,高兩位為區(qū)號,低兩位為位號。因此,區(qū)位碼與漢字或圖形符號之間是一一對應(yīng)的。一個漢字由兩個字節(jié)代碼表示。國標(biāo)碼
3、=2020H+區(qū)位碼例:“學(xué)”的區(qū)位碼為4907D國標(biāo)碼=3107H+2020H=5127H區(qū)位碼表01-09區(qū)為特殊符號。10-15區(qū)未有編碼。16-55區(qū)為一級漢字,按拼音排序。56-87區(qū)為二級漢字,按部首/筆畫排序。88-94區(qū)則未有編碼。漢字編碼——漢字機(jī)內(nèi)碼漢字機(jī)內(nèi)碼:計算機(jī)系統(tǒng)內(nèi)部標(biāo)識漢字的編碼。一個漢字由兩個字節(jié)組成,為了與ASCII碼區(qū)別,最高位均為1。機(jī)內(nèi)碼=區(qū)位碼+A0A0H機(jī)內(nèi)碼=國標(biāo)碼+8080H例:“學(xué)”字的區(qū)位碼為:3107H國標(biāo)碼為:5127H機(jī)內(nèi)碼=3107H+A0A0H=D1A7H=5127H+8080H=D1A7H8
4、080H=1000000010000000漢字編碼——漢字輸入碼輸入碼(各種輸入碼是不同的)鍵盤處理交換碼國標(biāo)碼高位改1機(jī)內(nèi)碼如輸入“學(xué)”;拼音輸xue國標(biāo)碼:雙字節(jié),高位為0得到“學(xué)”的國標(biāo)碼:0101000100100111得到學(xué)的機(jī)內(nèi)碼:1101000110100111漢字編碼——漢字字形碼漢字在顯示和打印輸出時,是以漢字字形信息表示的,即以點陣的方式形成漢字圖形。漢字字形碼是指確定一個漢字字形點陣的代碼(漢字字形碼)。一般采用點陣字形表示字符。目前普遍使用的漢字字型碼是用點陣方式表示的,稱為“點陣字模碼”。所謂“點陣字模碼”,就是將漢字像圖像一樣
5、置于網(wǎng)狀方格上,每格是存儲器中的一個位,16×16點陣是在縱向16點、橫向16點的網(wǎng)狀方格上寫一個漢字,有筆畫的格對應(yīng)1,無筆畫的格對應(yīng)0。這種用點陣形式存儲的漢字字型信息的集合稱為漢字字模庫,簡稱漢字字庫。通常漢字顯示使用16×16點陣,而漢字打印可選用24×24點陣、32×32點陣、64×64點陣等。漢字字形點陣中的每個點對應(yīng)一個二進(jìn)制位,1字節(jié)又等于8個二進(jìn)制位,所以16×16點陣字形的字要使用32個字節(jié)(16×16÷8字節(jié)=32字節(jié))存儲,64×64點陣的字形要使用512個字節(jié)。在16×16點陣字庫中的每一個漢字以32個字節(jié)存放,存儲一、二級漢字
6、及符號共8836個,需要282.5KB磁盤空間。而用戶的文檔假定有10萬個漢字,卻只需要200KB的磁盤空間,這是因為用戶文檔中存儲的只是每個漢字(符號)在漢字庫中的地址(內(nèi)碼)謝謝觀看!窗欞趣分享