資源描述:
《oracle修改字符集,解決亂碼問題》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、一針對oracle字符集介紹如下:Oracle字符集是一個字節(jié)數(shù)據(jù)的解釋的符號集合,有大小之分,有相互的包容關(guān)系。ORACLE支持國家語言的體系結(jié)構(gòu)允許你使用本地化語言來存儲,處理,檢索數(shù)據(jù)。它使數(shù)據(jù)庫工具,錯誤消息,排序次序,日期,時間,貨幣,數(shù)字,和日歷自動適應(yīng)本地化語言和平臺?!∮绊憃racle數(shù)據(jù)庫字符集最重要的參數(shù)是NLS_LANG參數(shù)。它的格式如下:NLS_LANG=language_territory.charset 它有三個組成部分(語言、地域和字符集),每個成分控制了NLS子集的特性。其中: Lang
2、uage指定服務(wù)器消息的語言,territory指定服務(wù)器的日期和數(shù)字格式,charset指定字符集。如:AMERICAN_AMERICA.ZHS16GBK 從NLS_LANG的組成我們可以看出,真正影響數(shù)據(jù)庫字符集的其實是第三部分。所以兩個數(shù)據(jù)庫之間的字符集只要第三部分一樣就可以相互導(dǎo)入導(dǎo)出數(shù)據(jù),前面影響的只是提示信息是中文還是英文。二查詢oracle字符集:很多人都碰到過因為字符集不同而使數(shù)據(jù)導(dǎo)入失敗的情況。這涉及三方面的字符集,一是oracelserver端的字符集,二是oracleclient端的字符集;三是d
3、mp文件的字符集。在做數(shù)據(jù)導(dǎo)入的時候,需要這三個字符集都一致才能正確導(dǎo)入。1查詢oracle數(shù)據(jù)庫客戶端字符集,使用sqlplus或者使用sql語句:select*fromnls_database_parameters;這里的NLS_CHARACTERSET是數(shù)據(jù)庫字符集,NLS_NCHAR_CHARACTERSET是國家字符集ORACLE中有兩大類字符型數(shù)據(jù),VARCHAR2是按照數(shù)據(jù)庫字符集來存儲數(shù)據(jù)。而NVARCHAR2是按照國家字符集存儲數(shù)據(jù)的。同樣,CHAR和NCHAR也一樣,一是數(shù)據(jù)庫字符符,一是國家字符集
4、。字符集不同,二進制碼的組合就不同。比如有一串二進制信息:1101,0110,1101,0000,1011,1001,1111,1010,按照16位雙字節(jié)GBK字符集理解,可以代表“中國”兩個字。如果單字節(jié)的字符集,這一串二進制代表ASC碼為214、208、185、250的四個怪字符。2也可以通過如下sql進行查詢數(shù)據(jù)庫字符集SQL>selectuserenv('language')fromdual;USERENV('LANGUAGE')-----------------------------------------
5、---------------------------------------AMERICAN_AMERICA.AL32UTF8方法1和2可以查詢oracleserver的字符集.3查詢dmp文件的字符集用oracle的exp工具導(dǎo)出的dmp文件也包含了字符集信息,dmp文件的第2和第3個字節(jié)記錄了dmp文件的字符集。如果dmp文件不大,比如只有幾M或幾十M,可以用UltraEdit打開(16進制方式),看第2第3個字節(jié)的內(nèi)容,如0354,然后用以下SQL查出它對應(yīng)的字符集:SQL>selectnls_charset_
6、name(to_number('0354','xxxx'))fromdual; ZHS16GBK如果dmp文件很大,比如有2G以上(這也是最常見的情況),用文本編輯器打開很慢或者完全打不開,可以用以下命令(在unix主機上):catexp.dmp
7、od-x
8、head-1
9、awk'{print$2$3}'
10、cut-c3-6然后用上述SQL也可以得到它對應(yīng)的字符集。4查詢oracleclient字符集a在windows平臺下,就是注冊表里面相應(yīng)OracleHome的NLS_LANG。還可以在dos窗口里面自己設(shè)置,比如:
11、setnls_lang=AMERICAN_AMERICA.ZHS16GBK這樣就只影響這個窗口里面的環(huán)境變量,如下截圖:windows:注冊表下oracle->HOMEO下b在unix平臺下,就是環(huán)境變量NLS_LANG。$echo$NLS_LANG AMERICAN_AMERICA.ZHS16GBK如果檢查的結(jié)果發(fā)現(xiàn)server端與client端字符集不一致,請統(tǒng)一修改為同server端相同的字符集。三修改數(shù)據(jù)庫字符集oracle的字符集有互相的包容關(guān)系。如us7ascii就是zhs16gbk的子集,從us7asci
12、i到zhs16gbk不會有數(shù)據(jù)解釋上的問題,不會有數(shù)據(jù)丟失。在所有的字符集中utf8應(yīng)該是最大,因為它基于unicode,雙字節(jié)保存字符(也因此在存儲空間上占用更多)。一旦數(shù)據(jù)庫創(chuàng)建后,數(shù)據(jù)庫的字符集理論上講是不能改變的。因此,在設(shè)計和安裝之初考慮使用哪一種字符集十分重要。根據(jù)Oracle的官方說明,字符集的轉(zhuǎn)換是從子集到超集受支