📖JAVA服务端GET请求URL中文参数乱码

发布： 2019-04-05

热度： 52

趋势： 52

权重： 0

分类： 后端编程

标签： JAVA  请求  解码

🎯

公司的老WEB项目的内部链接跳转时使用了GET请求并且携带参数进行传递，在绝大多数情况没问题，但携带中文参数时后台获取的内容会出现乱码的问题（事实上我们并不建议用GET请求传递太多参数）

问题描述

无论从安全性还是前后端数据处理的便捷性来说，使用 POST 请求会是绝大多数程序猿的首选。

不过有时候中途投入某些项目的时候，你会发现整个项目的前后端结构已经固化。

程序猿在时间不充裕的情况下只能去适应项目的现有风格。

使用 GET 请求直接传递关键参数至服务端是比较不安全的做法，考虑到这个 WEB 项目是内网工程，倒也无可厚非。

因此问题出现了，GET 请求直接携带中文，后台接受时会出现乱码。

前端 encodeURI 编码

处理中文参数乱码的第一个步骤是在前端界面对参数进行 encodeURI 编码。

实验表明需要编两次，具体原因似乎是编码类型。

第二次编码的数据无论你原来是什么编码类型，都会变成 UTF-8。

//请求url拼接
var url = "www.mebugs.com/getUser.go?id="+id+"&name="+encodeURI(encodeURI(name));

题外话：假设页面端输入的中文是一个“中”，按照下面步骤进行解：
第一次 encodeURI，按照 utf-8 方式获取字节数组变成[-28,-72-83]，对字节码数组进行遍历，把每个字节转化成对应的 16 进制数，这样就变成了[E4,B8,AD],最后变成[%E4,%B8,%AD]，此时已经没有了多字节字符，全部是单字节字符。
第二次 encodeURI，进行编码会把 % 看成一个转义字符，并不编码 % 以后字符，会把 % 编码成 %25.把数组最后变成[%25E4,%25B8,%25AD]然后就把处理后的数据[%25E4,%25B8,%25AD]发往服务器端。
应用服务器调用 getParameter 方法，getParameter 方法会去向应用服务器请求参数。
应用服务器最初获得的就是发送来的[%25E4,%25B8,%25AD]，应用服务器会对这个数据进行 URLdecode 操作进行解码，不管是按照 UTF-8，还是 GBK，还是 ISO-8859，都能得到[%E4,%B8,%AD]，因为都会把 %25 解析成 %，并把这个值返回给 getParameter 方法。
再用 UTF-8 解码一次，就得到"中"了。
如果不编码两次，当服务器自动解码的时候，假如是按照 ISO-8859 去解码 UTF-8 编码的东西，就是会出现乱码。

服务端解码

服务端使用 URLDecoder.decode 对 get 请求携带的参数进行解码。

String name = "";
try{
  name = URLDecoder.decode(request.getParameter("name")!=null?request.getParameter("name"):"","UTF-8");   
} catch (UnsupportedEncodingException e)
{ 
  //追加捕获异常的后续处理逻辑
}