"charset"方法处置一下3超级链接方式:先将链接url中的汉字用java.net.URLEncoder.encod"paramValue".
英语是母语,计算机生于美国。而英语以外的其它语言对他来说都是外语。跟我一样,不管外语掌握到什么水平,也不会像母语那样使用得那么好,时常也会出一些“拼写错误”问题。
用UTF-8去解码结果肯定都是火星文。所以要解决这个问题,乱码的出现根本原因在于编码和解码使用了不同的编码方案。比如用GBK编码的文件。中心思想就在于使用统一的编码方案。
并且这两个窗口是父子的关系,jsp页面间的参数传送有以下几种方式:1表单(form提交。2直接使用URL后接参数的形式(超级链接)3如果两个jsp页面在两个不同的窗口中。子窗口中的jsp也可以使用javascript和DOMwindow.opener.XXX.valu来取得父窗口中的jsp输入元素的值。下面就前两种方式中出现的乱码问题做一下剖析。
1表单(form提交实现参数页面间的传送
先来了解一些预备知识。表单的提交方式和请求报文中对汉字的处置。介绍表单传递参数的内容之前。
表单的提交方式:
没有长度的限制;get方式则是把数据内容直接跟在请求的头部的URL后面,通常使用的表单的提交方式主要是post和get两种。两者的区别在于:post方式是把数据内容放在请求的数据正文局部。有长度的限制。下面是同一个页面两种方式的请求报许文。
Requesttest.jsp代码
<%@pagelanguage="java"contentType="text/html;charset=UTF-8"
pageEncoding="UTF-8"%>
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDHTML4.01Transitional//EN""http://www.w3.org/P/html4/loose.dtd">
<html>
<head>
<metahttp-equiv="Content-Type"content="text/html;charset=UTF-8">
<title>Inserttitlhere</title>
</head>
<body>
<%--post方式提交表单 --%>
<formaction="http://localhost:8888/EncodingTest/requestresult.jsp"method="post">
UserName:<inputtype="text"name="username"/>
Password:<inputtype="password"name="password"/>
<inputtype="submit"value="Submit">
</form>
</body>
</html>
<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%><!DOCTYPEhtmlPUBLIC"-//W3C//DTDHTML4.01Transitional//EN""http://www.w3.org/P/html4/loose.dtd"><html><head><metahttp-equiv="Content-Type"content="text/html;charset=UTF-8"><title>Inserttitlhere</title></head><body><%--post方式提交表单 --%><formaction="http://localhost:8888/EncodingTestb/requestresult.jsp"method="post">UserName:<inputtype="text"name="username"/>Password:<inputtype="password"name="password"/><inputtype="submit"value="Submit"></form></body></html>
password输入框中输入"123"后按下Submit按钮提交请求。截获到请求报文如下:上面的请求页面的usernam输入框里输入的世界杯”三个汉字。
Post方式的请求报文代码
POST/EncodingTest/requestresult.jspHTTP/1.1
image/jpeg, Accept:image/gif.image/pjpeg,image/pjpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/*
Referer:http://localhost:8080/TomcatJndiTest/requesttest.jsp
Accept-Language:zh-cn
User-A gent:Mozilla/4.0compatible;MSIE8.0;WindowNT5.1;Trident/4.0;CIBA ;aff-kingsoft-ciba;.NETCLR2.0.50727
Content-Type:application/x-www-form-urlencoded
deflate Accept-Encoding:gzip.
Host:localhost:8888
Content-Length:49
Connection:Keep-A live
Cache-Control:no-cache
username=%E4%B8%96%E7%95%8C%E6%9D%A F&password=123
image/jpeg, POST/EncodingTest/requestresult.jspHTTP/1.1Accept:image/gif.image/pjpeg,image/pjpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/*Referer:http://localhost:8080/TomcatJndiTest/requesttest.jspAccept-Language:zh-cnUser-A gent:Mozilla/4.0compatible;MSIE8.0;WindowNT5.1;Trident/4.0;CIBA ;aff-kingsoft-ciba;.NETCLR2.0.50727Content-Type:application/x-www-form-urlencodAccept-Encoding:gzip,deflatHost:localhost:8888Content-Length:49Connection:Keep-A livCache-Control:no-cachusername=%E4%B8%96%E7%95%8C%E6%9D%A F&password=123
可以看出post方式的请求报文是有专门的数据部的以上报文内容。
下面的同一请求页面的get提交方式的请求报文:
Get方式的请求报文代码
GET/EncodingTest/requestresult.jsp?username=%E4%B8%96%E7%95%8C%E6%9D%A F&password=123HTTP/1.1
image/jpeg, Accept:image/gif.image/pjpeg,image/pjpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/*
Referer:http://localhost:8080/TomcatJndiTest/requesttest.jsp
Accept-Language:zh-cn
User-A gent:Mozilla/4.0compatible;MSIE8.0;WindowNT5.1;Trident/4.0;CIBA ;aff-kingsoft-ciba;.NETCLR2.0.50727
deflate Accept-Encoding:gzip.
Host:localhost:8888
Connection:Keep-A live
image/jpeg, GET/EncodingTest/requestresult.jsp?username=%E4%B8%96%E7%95%8C%E6%9D%A F&password=123HTTP/1.1Accept:image/gif.image/pjpeg,image/pjpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/*Referer:http://localhost:8080/TomcatJndiTest/requesttest.jspAccept-Language:zh-cnUser-A gent:Mozilla/4.0compatible;MSIE8.0;WindowNT5.1;Trident/4.0;CIBA ;aff-kingsoft-ciba;.NETCLR2.0.50727Accept-Encoding:gzip,deflatHost:localhost:8888Connection:Keep-A live
可以看出get方式的请求报文没有专门的数据部,以上报文内容。数据是直接跟在url后面。
请求报文中对汉字的处置:
然后发给服务器的看到这,从上面两种报文可以看出页面上输入的世界杯”三个汉字被替换成了"%E4%B8%96%E7%95%8C%E6%9D%A F这样一个字符串。可能会有两个问题:问题一、这个字符串是什么?问题二、为什么要做这样的替换?
理解是因为请求报文会以"ISO-8859-1"编码方式编码后,这个字符串是世界杯”这三个汉字对应的"UTF-8编码"E4B896E7958CE69DA F"每个字节前追加一个"%"后形成的至于为什么要做这样的转化。通过网络流的方式传送到服务器端。"ISO-8859-1"仅支持数字、英文字母和一些特殊字符,所以像汉字等这样的字符"ISO-8859-1"不认识的所以就必需先给这些"ISO-8859-1"不支持的字符做个“整形”手术。这样才干正确的将页面上的信息传送到服务器端。
其它编码方案可以吗?答案是可以的jsp页面代码的头部有这样一段代码"<%@pagelanguage="java"contentType="text/html;charset=UTF-8"pageEncoding="UTF-8"%>"其中charset值就是浏览器在提交请求报文前,这时可能又会有另外一个问题:上面的例子中为什么会选用"UTF-8"编码。对请求报文做“整形”手术时用的字符集,同是也是浏览器解释服务器的响应页面时的字符集。
开始剖析表单方式传递参数的乱码问题。解了以上内容后。
点击"Submit"按钮后,以上例为例。浏览器将做完“整形”手术后的请求报文发送给WEB服务器上的Servlet容器,容器在收到这个请求报文后,会解析这个请求报文并用这个报文的信息生成一个HttpServletRequest对象,然后将这个HttpServletRequest对象传给这个页面所要请求的jsp或Servlet上例中为"requestresult.jsp"这个被请求的jsp或Servlet上例中为"requestresult.jsp"中,使用HttpServletRequest对象的getParamet""方法来取得上一页面传来的参数。默认情况下,这一方法使用的"ISO-8859-1"来解码,所以对于英文或数字的参数值自然能正确取得,但对于汉字这样的字符是解不出来的因为那几个汉字曾经做过“整形”手术,已经认不出来了要想再把它认出来,那就得要把手术的主刀医生找到然后再做一次“还原”手术。下面提供的几个方案,可用于不同的情况。
方案一代码
"utf-8";%> <%Stringstr=newStringrequest.getParamet"username".getByt"ISO-8859-1".
Username:<%=str%>
"utf-8";%>Username:<%=str%> <%Stringstr=newStringrequest.getParamet"username".getByt"ISO-8859-1".
也就是request.getParamet"username".getByt"ISO-8859-1"最后再用跟你页面的charset一致的字符集来重组这个字符串:newStringrequest.getParamet"username".getByt"ISO-8859-1",既然request.getParamet"username"默认情况下返回的字符串是用"ISO-8859-1"解出来的那就先把这个不可识别的字符串再用"ISO-8859-1"来打散。"utf-8"这样就能见到庐山真面目了
不论是post还是get都适用,方案一是一种比较万能的方法。但可以看出它缺点是对于每个可能出现汉字的参数都要显示的做这么一段处理。一个两个还行,要是很多的话,那就应该考虑一下是不是可以选用下一种方案。
方案二代码
<%request.setCharacterEncod"UTF-8";%>
<%request.setCharacterEncod"UTF-8";%>
作用是用作为参数传入的编码集去覆盖request对象中的默认的"ISO-8859-1"编码集。这样request.getParamet""方法就会用新的编码集去解码,方案二是页面的最开始或者是该页面中使用的第一个request.getParamet""方法之前加上上述一段代码。因为"UTF-8"支持中文,所以作为参数传过来的世界杯”三个汉字就能正确的接收到但关于request.setCharacterEncod""方法,API文档中有如下的说明:
ithanoeffectbOverridthenameofthecharactencodusinthebodiofthirequest.ThimethodmustbecallpriortoreadrequestparametorreadinputusgetRead.Otherwise..
因为参数都在requestbodi区。而对get方式提交的请求则是无效的这时你会发现同样的做法但显示的还是乱码。所以你请求要是以get方式提交的话,所以方案二只对post方式提交的请求有效。那你还是乖乖的选用方案一吧!
方案二需要在每个页面的前头加上<%request.setCharacterEncod"UTF-8";%>这段代码,从上面的叙述可以知道。这样做是不是也挺累的所以我想到使用过滤器来帮助我做这件事儿,那就清爽、简单多了
Encodingfilt代码
publicclassEncodingFiltimplementFilter{
privatStringcharset;
@Override
publicvoiddestroi{
//TODOAuto-genermethodstub
}
@Override
ServletResponsresponse, publicvoiddoFiltServletRequestrequest.
ServletExcept{ FilterChainchainthrowIOException.
//用init方法取得的charset覆盖被拦截下来的request对象的charset
request.setCharacterEncodthis.charset;
如果还有的情况下。 //将请求移交给下一下过滤器。
respons; chain.doFiltrequest.
}
@Override
publicvoidinitFilterConfigconfigthrowServletExcept{
//从web.xml中的filter配制信息中取得字符集
this.charset=config.getInitParamet"charset";
}
}
如果还有的情况下。chain.doFiltrequest, publicclassEncodingFiltimplementFilter{privatStringcharset;@Overridpublicvoiddestroi{//TODOAuto-genermethodstub}@OverridpublicvoiddoFiltServletRequestrequest,ServletResponsresponse,FilterChainchainthrowIOException,ServletExcept{//用init方法取得的charset覆盖被拦截下来的request对象的charsetrequest.setCharacterEncodthis.charset;//将请求移交给下一下过滤器。respons;}@OverridpublicvoidinitFilterConfigconfigthrowServletExcept{//从web.xml中的filter配制信息中取得字符集 this.charset=config.getInitParamet"charset";}}
还得到web.xml里加入下面的配制信息。要想这个过滤器生效。
Web.xml代码
<filter>
<filter-name>EncodingFilter</filter-name>
<filter-class>cn.eric.encodingtest.filter.EncodingFilter</filter-class>
<init-param>
<param-name>charset</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>EncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
<filter><filter-name>EncodingFilter</filter-name><filter-class>cn.eric.encodingtest.filter.EncodingFilter</filter-class><init-param><param-name>charset</param-name><param-value>UTF-8</param-value></init-param></filter><filter-mapping><filter-name>EncodingFilter</filter-name><url-pattern>/*</url-pattern></filter-mapping>
2直接使用URL后接参数的形式(超级链接)
而刚好这个参数的值有可能会出现中文的情况。就像下面这样:有些时候可能会遇到通过一个超级链接来把参数传到下一个页面。
<ahref="./jstlresult.jsp?content=世界杯">GoSouthAfrica
而不是http://localhost:8080/TomcatJndiTest/jstlresult.jsp?content=%E4%B8%96%E7%95%8C%E6%9D%A Fhttp://localhost:8080/TomcatJndiTest/jstlresult.jsp?content=世界杯.>
所以这里要自己动手,这里浏览器并没有帮我把这个转化工作搞定。丰衣足食了做法如下:
"utf-8"%>">GoSouthAfrica <ahref="./jstlresult.jsp?content=<%=java.net.URLEncoder.encod"世界杯".
这样的话在第二个页面就能使用
"utf-8";%> <%Stringstr=newStringrequest.getParamet"content".getByt"ISO-8859-1".
方法来正确的得到这个参数值了
总结一下:
将到达页面前的request对象中的字符编码设定成跟你页面统一的编码。1post提交的方式:使用过滤器。
"utf-8";%>这样的字符串重组的方法。2get提交的方式:<%Stringstr=newStringrequest.getParamet"content".getByt"ISO-8859-1".