以下的文章主要讲述的是如何配合rails的Oracle字符集配置,其中包括Oracle字符集配置先决条件的介绍,还有可变的条件的相关介绍,你如果对其相关的操作感兴趣的话,以下的文章,你一定不要错过。
Oracle中文字符显示的问题
rails2..02 中对页面表单提交,单个中文字的问题
Rails默认的设置适合于MySQL,但我的工作环境往往是Oracle,于是需要针对Oracle重新进行配置。
下载和安装Oralce Rails库,需要给Rails应用所在的服务器安装Oracle的客户端;
更改config/database.yml文件,基本的配法如下:
ruby 代码
Oracle: adapter:oci username:rails password:rails host:10.11.16.63/ORCL
相信用过Oracle的人都很容易理解上面的字段和格式的含义。另外说一下,冒号后一定要留一个空格,否则在执行ruby script/server时就会报错。
基本连接的配置就是这样了,但对一个中国的开发人员来说,通常情况下,新的框架、新的数据库配置一般会带来字符编码的问题。
Oracle字符集配置
先绝条件1: Rails默认使用UTF-8字符集保存文件,暂时不考虑修改成GBK。
先绝条件2: Oralce服务器使用AMERICAN _ AMERICA.zhs16gbk编码,是一个公共的开发环境,因此除非迫不得已,不考虑对编码进行调整。
可变的条件: Rails应用所在服务器的Oracle客户端字符集,当前也是ZHS16GBK,但可以调整。
按照现在的配置,运行rails,进行中文信息的填写、提交、显示。发现不错,在web上显示的一切正常。但是,用常用的toad登录Oralce,一看全部显示乱码。即使用Oracle自带的那个java写的客户端连上去,也是显示乱码。
有的帖子里面写了把客户端的nls_lang设置的和服务器一样,就能解决乱码问题。前面的条件也符合这种要求,web上的显示也确实正确。但是数据库客户端显示不正常,显然不让人接受,以后万一要导数据等等,那就会麻烦很多。
于是开始尝试各种解决办法,直到看见了这篇关于Oracle字符集的文章,才算豁然开朗。
Oracle字符集配置问题其实牵涉到3个概念:操作系统字符集(输入/显示),客户端字符集,数据库字符集。
"客户端字符集就是为了让数据库知道我们传递过去的字符是属于那种字符集,以便于Oracle在存储字符(数据库字符集)时做相应的编码映射。" 操作系统字符集其实就是输入/显示的字符,在rails中输入就是就是rails提交的编码,显示则是由浏览器根据编码进行解析.
简单地说,先决条件1就是输入字符集,先决条件2就是数据库字符集,而可变的条件就是客户端字符集。之前,在客户端和数据库端都是ZHS16GBK的情况下,web能成功显示,是因为保存和取出的都是utf-8编码的字符,而数据库自己查看失败就在于在nls_lang=ZHS16GBK的情况下,无法正确解析实际是按utf-8存放的内容。
简单地把客户端字符集设置和数据库一致,仅仅实现了数据(按utf-8编码)的透传。而真的要让数据在库中以数据库字符集编码形式保存,需要将客户端字符集改成和输入字符集一致的字符集。因此,如果Rails输入的信息是UTF-8,那么应该将Rails应用服务器的Oracle客户端设置成 nls_lang=UTF8。
如此的话,客户端字符集让数据库知道我们传递过去的字符是属于哪种字符集,以便于Oracle在存储字符时做相应的编码映射,这样数据就按数据库字符集被保存了。
***还要说的一个问题,就是nls_lang=AMERICAN_AMERICA.UTF8在哪里进行设置。
在windows下,可以在注册表下以及dos窗口里面设置。在注册表下设置的话,除影响Rails外,还会影响toad以及Oracle自带的客户端。而此时,web一切正常,Oracle自带的客户端查看数据也正常,但是toad的显示还是不正常。
换成在启动Rails前先执行 set nls_lang=AMERICAN_AMERICA.UTF8 ,这样把影响局限在Rails应用中,注册表中依旧采用ZHS16GBK,那么web、toad、Oracle自带客户端就全都正常了。更进一步,set nls_lang=AMERICAN_AMERICA.UTF8 可以放入rails目录下的use_ruby.cmd,这样就会自动设置这个变量了。
综上所述,对于Rails来说,如果选择按UTF8来进行数据的传递,那么只要存入/获取的数据都是UTF8编码的,在web上就能一切正常。透传的话不影响Rails的正常工作,但保存数据的字符集就未必是数据库的字符集了。
客户端字符集变量的作用就是告诉数据库传的信息是按什么编码的,然后数据库就能做相应的转换,按数据库自己的字符集进行存放,而在取出时也能做相应的转换。所以说,需要将客户端字符集改成和输入字符集一致。