oracle字符集简介
一、字符集介绍
字符集和国家字符集
字符集在创建数据库实例时指定,可以指定字符集(CHARACTER SET)和国家字符集(NATIONAL CHARACTER SET)。
1、字符集(CHARACTER SET)
用来存储char、varchar2、clob、long等类型数据,还可以用来标识表名、列名以及PL/SQL变量等。
2、国家字符集(NATIONAL CHARACTER SET)
用以存储nchar、nvarchar2、nclob等类型数据。国家字符集实质上是为Oracle选择的附加字符集,主要作用是为了增强字符处理能力,因为nchar数据类型可以提供对亚洲使用定长多字节编码的支持,而数据库字符集则不一定能。国家字符集只能在unicode编码中的AF16UTF16和UTF8中选择,默认值是AF16UTF1
3、NLS_LANG参数
Oracle数据库字符集最重要的参数是NLS_LANG参数。
格式: NLS_LANG='language_territory.charset',不区分大小写,例如' SIMPLIFIED CHINESE_CHINA.ZHS16GBK'。
它有三个组成部分:语言(language)、地域(territory)和字符集(charset)。
其中:
language:数据库服务器提示信息的语言。
territory:数据库的日期和数字格式,意义不大。
charset:数据库的字符集。
真正影响数据库字符集的其实是第三部分charset,两个数据库之间的字符集只要第三部分相同,交换数据时中文不会出现乱码。language影响的只是提示信息是中文还是英文。
二、查看数据库的字符集
1、查看当前数据库server端的字符集:
select userenv('language') from dual;
2、查看dump文件的字符集
用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:
如果dmp文件很大,比如有2G以上(这也是最常见的情况),用文本编辑器打开很慢或者完全打不开,可以用以下命令(在unix主机上):
cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6
然后用以下SQL查出它对应的字符集:
select nls_charset_name(to_number('0354','xxxx')) from dual;
3、查询oracle client端的字符集
在windows平台下,就是注册表里面相应OracleHome的NLS_LANG。还可以在dos窗口里面自己设置,
比如: set nls_lang=AMERICAN_AMERICA.ZHS16GBK
这样就只影响这个窗口里面的环境变量。
在unix平台下,就是环境变量NLS_LANG。
$echo $NLS_LANG
设置的就是在环境变量里面设置
export NLS_LANG='AMERICAN_AMERICA.ZHS16GBK'