公司的老WEB项目的内部链接跳转时使用了GET请求并且携带参数进行传递,在绝大多数情况没问题,但携带中文参数时后台获取的内容会出现乱码的问题(事实上我们并不建议用GET请求传递太多参数)
无论从安全性还是前后端数据处理的便捷性来说,使用 POST 请求会是绝大多数程序猿的首选。
不过有时候中途投入某些项目的时候,你会发现整个项目的前后端结构已经固化。
程序猿在时间不充裕的情况下只能去适应项目的现有风格。
使用 GET 请求直接传递关键参数至服务端是比较不安全的做法,考虑到这个 WEB 项目是内网工程,倒也无可厚非。
因此问题出现了,GET 请求直接携带中文,后台接受时会出现乱码。
处理中文参数乱码的第一个步骤是在前端界面对参数进行 encodeURI 编码。
实验表明需要编两次,具体原因似乎是编码类型。
第二次编码的数据无论你原来是什么编码类型,都会变成 UTF-8。
//请求url拼接
var url = "www.mebugs.com/getUser.go?id="+id+"&name="+encodeURI(encodeURI(name));
题外话:假设页面端输入的中文是一个“中”,按照下面步骤进行解:
第一次 encodeURI,按照 utf-8 方式获取字节数组变成[-28,-72-83],对字节码数组进行遍历,把每个字节转化成对应的 16 进制数,这样就变成了[E4,B8,AD],最后变成[%E4,%B8,%AD],此时已经没有了多字节字符,全部是单字节字符。
第二次 encodeURI,进行编码会把 % 看成一个转义字符,并不编码 % 以后字符,会把 % 编码成 %25.把数组最后变成[%25E4,%25B8,%25AD]然后就把处理后的数据[%25E4,%25B8,%25AD]发往服务器端。
应用服务器调用 getParameter 方法,getParameter 方法会去向应用服务器请求参数。
应用服务器最初获得的就是发送来的[%25E4,%25B8,%25AD],应用服务器会对这个数据进行 URLdecode 操作进行解码,不管是按照 UTF-8,还是 GBK,还是 ISO-8859,都能得到[%E4,%B8,%AD],因为都会把 %25 解析成 %,并把这个值返回给 getParameter 方法。
再用 UTF-8 解码一次,就得到"中"了。
如果不编码两次,当服务器自动解码的时候,假如是按照 ISO-8859 去解码 UTF-8 编码的东西,就是会出现乱码。
服务端使用 URLDecoder.decode 对 get 请求携带的参数进行解码。
String name = "";
try{
name = URLDecoder.decode(request.getParameter("name")!=null?request.getParameter("name"):"","UTF-8");
} catch (UnsupportedEncodingException e)
{
//追加捕获异常的后续处理逻辑
}
非常不建议在 GET 请求中传递重要的参数,特别是中文类的参数。
我们在编码过程中必然会遇到 GET 请求的地方,建议用于传递 ID 类的主键参数。
温馨提示:系统将通过浏览器临时记忆您曾经填写的个人信息且支持修改,评论提交后仅自己可见,内容需要经过审核后方可全面展示。