URL 汉语言特殊字符乱码处理

2013-09-12

URL中文特殊字符乱码处理前提先了解浏览器解析url：关于不同浏览器对URL编码的分析1.js端：encodeURI 编码2

URL 中文特殊字符乱码处理

前提先了解浏览器解析url：关于不同浏览器对URL编码的分析

js端：encodeURI 编码2次，具体原因见下面：

服务器端：js:decodeURI或者后台：URLDecoder.decode(name, "UTF-8");

直接在jsp文件中URLEncoder.encode(name, "UTF-8");

在后台：URLDecoder.decode(request.getParameter("name"), "UTF-8");

注意（encodeURI 编码2次原因）：

地址栏中出现汉字的情况有两种，一种是汉字出现在URL的路径部分，一种是汉字出现在URL的传参的部分，第二种情况的时候必须采用编码后传参，接受时解码的方式完成传参。js中编码有escape(),encodeURI(),encodeURIComponent()三个常用的方法，escape()常常用在提交页面和处理页面的编码格式相同的情况下（比如它们都是GB2312），encodeURI()和encodeURIComponent()的用法基本相同，区别在于encodeURIComponent()也对"?"等特殊字符进行编码。
一开始遇到中文参数的时候，使用encodeURI()进行了一遍编码，传过去后，发现解码出现问题，于是想到可能是编码方法使用错误，于是使用escape()方法，这时发现解码时抛出isHexDigit异常。借助百度搜索isHexDigit异常，
发现原来，是escape()方法造成了异常，同时了解了浏览器传递地址的一些原理，在浏览器地址栏里，浏览器认为%是个转义字符，浏览器会把%与%之间的编码，两位两位取出后进行解码,然后再传递给处理页面，
然后由处理页面进行再次解码。由此我想到一直使用encodeURI方法是正确的，只是需要使用两次encodeURI方法，例如encodeURI(encodeURI("中文"));第一次是把中文编码成%xy的格式，
第二次是对%xy中的%进行编码,%编码成%25。整个传参过程大体应该是：提交页面使用encodeURI(encodeURI("中文"))编码,把最后的编码结果%25xy传递给处理页面的过程中，浏览器获取URL地址
（注意openModelDialog方法，浏览器获取不到参数编码）后解码成%xy，然后把%xy传递给处理页面,处理页面使用URLDecoder.decode(request.getParameter("参数名"),"UTF-8");完成解码。
总结：
1、汉字出现在URL路径部分的时候不需要编码解码;
2、使用encodeURI进行2次编码;
3、在openModelDialog()打开的模式窗体里没办法用request.getParameter正确获取参数;

客户端和服务器在传递数据时可以用过滤器filter解决字符编码问题，但filter只能解决post方式提交的数据。对于get方式，可以使用两次encodeURI(encodeURI(“中文”))并在服务器中使用URLDecoder.decode(“中文”, "UTF-8");

今天用Ajax校验数据时也遇到这个问题，尽管页面、类和web容器都统一了字符编码，提交的数据依然是乱码，所以就采用了2次encodeURI()编码方式，乱码问题就解决了。
页面
var name=document.myForm.username.value;
var url="Ajax.do?method=check&name="+encodeURI(encodeURI(name));
xmlHttp.open("GET",url,true);
action中
String name = request.getParameter("name");
name = URLDecoder.decode(name, "UTF-8");

servlet返回数据时，将字符编码设置为utf-8就可以了，因为Ajax只支持utf-8
response.setContentType("text/xml;charset=utf-8");
PrintWriter out = response.getWriter();
out.print(result);

热点排行

Web前端

URL 汉语言 特殊字符 乱码处理

URL 汉语言特殊字符乱码处理