📖JAVA服务端GET请求URL中文参数乱码

发布: 2019-04-05
热度: 52
趋势: 52
权重: 0
🎯

公司的老WEB项目的内部链接跳转时使用了GET请求并且携带参数进行传递,在绝大多数情况没问题,但携带中文参数时后台获取的内容会出现乱码的问题(事实上我们并不建议用GET请求传递太多参数)

问题描述

无论从安全性还是前后端数据处理的便捷性来说,使用 POST 请求会是绝大多数程序猿的首选。

不过有时候中途投入某些项目的时候,你会发现整个项目的前后端结构已经固化。

程序猿在时间不充裕的情况下只能去适应项目的现有风格。

使用 GET 请求直接传递关键参数至服务端是比较不安全的做法,考虑到这个 WEB 项目是内网工程,倒也无可厚非。

因此问题出现了,GET 请求直接携带中文,后台接受时会出现乱码。

前端 encodeURI 编码

处理中文参数乱码的第一个步骤是在前端界面对参数进行 encodeURI 编码。

实验表明需要编两次,具体原因似乎是编码类型。

第二次编码的数据无论你原来是什么编码类型,都会变成 UTF-8。

//请求url拼接
var url = "www.mebugs.com/getUser.go?id="+id+"&name="+encodeURI(encodeURI(name));

题外话:假设页面端输入的中文是一个“中”,按照下面步骤进行解:
第一次 encodeURI,按照 utf-8 方式获取字节数组变成[-28,-72-83],对字节码数组进行遍历,把每个字节转化成对应的 16 进制数,这样就变成了[E4,B8,AD],最后变成[%E4,%B8,%AD],此时已经没有了多字节字符,全部是单字节字符。
第二次 encodeURI,进行编码会把 % 看成一个转义字符,并不编码 % 以后字符,会把 % 编码成 %25.把数组最后变成[%25E4,%25B8,%25AD]然后就把处理后的数据[%25E4,%25B8,%25AD]发往服务器端。
应用服务器调用 getParameter 方法,getParameter 方法会去向应用服务器请求参数。
应用服务器最初获得的就是发送来的[%25E4,%25B8,%25AD],应用服务器会对这个数据进行 URLdecode 操作进行解码,不管是按照 UTF-8,还是 GBK,还是 ISO-8859,都能得到[%E4,%B8,%AD],因为都会把 %25 解析成 %,并把这个值返回给 getParameter 方法。
再用 UTF-8 解码一次,就得到"中"了。
如果不编码两次,当服务器自动解码的时候,假如是按照 ISO-8859 去解码 UTF-8 编码的东西,就是会出现乱码。

服务端解码

服务端使用 URLDecoder.decode 对 get 请求携带的参数进行解码。

String name = "";
try{
  name = URLDecoder.decode(request.getParameter("name")!=null?request.getParameter("name"):"","UTF-8");   
} catch (UnsupportedEncodingException e)
{ 
  //追加捕获异常的后续处理逻辑
}

结尾小结

非常不建议在 GET 请求中传递重要的参数,特别是中文类的参数。

我们在编码过程中必然会遇到 GET 请求的地方,建议用于传递 ID 类的主键参数。

当前文章暂无讨论,留下脚印吧!
大纲
  • 问题描述
  • 前端 encodeURI 编码
  • 服务端解码
  • 结尾小结
提交成功,请等待审核通过后全面展示!

发表评论

昵称
邮箱
链接
签名
评论

温馨提示:系统将通过浏览器临时记忆您曾经填写的个人信息且支持修改,评论提交后仅自己可见,内容需要经过审核后方可全面展示。

选择头像