首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > Web前端 >

java URLRewrite的配备和使用

2012-08-19 
java URLRewrite的配置和使用简介??? UrlRewriteFilter is a Java Web Filter for any J2EE compliant web

java URLRewrite的配置和使用

简介

??? UrlRewriteFilter is a Java Web Filter for any J2EE compliant web application server (such as Resin, Orion or Tomcat), which allows you to rewrite URLs before they get to your code. It is a very powerful tool just like Apache's mod_rewrite.

??? urlRewriteFilter是一个用于改写URL的Web过滤器,类似于Apache的mod_rewrite。适用于任何Web应用服务器(如Resin,Orion,Tomcat等)。其典型应用就把动态URL静态化,便于搜索引擎爬虫抓取你的动态网页。

使用

??? urlRewriter是利用过滤器实现URL转换的,具体使用方法如下:

1. 首先要在网上下载 urlRewriter.jar(建议最新版本 官网下载地址:tuckey.org/urlrewrite/) 。

2. 配置web.xml,其实就是配置一个Filter。

<filter>

???<filter-name>UrlRewriteFilter</filter-name>

???<filter-class>org.tuckey.web.filters.urlrewrite.UrlRewriteFilter</filter-class>

??? <init-param> (这个可以不写,是配置UrlRewriter日志的配置,级别定成WARN)
?? ??? ??? ?<param-name>logLevel</param-name>
?? ??? ??? ?<param-value>WARN</param-value>
?? ? </init-param>

</filter>

<filter-mapping>

?? <filter-name>UrlRewriteFilter</filter-name>

?? <url-pattern>/*</url-pattern>

? ?<! - - 下两项可以不写 - ->??????

?? <dispatcher>REQUEST</dispatcher>??????

??<dispatcher>FORWARD</dispatcher>???

</filter-mapping>??

3、在WEB-INF 目录下新建一个urlrewrite.xml(名称一定要正确)文件内容如下:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE urlrewrite PUBLIC "-//tuckey.org//DTD UrlRewrite 3.1//EN" "urlrewrite3.1.dtd">
<!--? Configuration file for UrlRewriteFilter http://tuckey.org/urlrewrite/ -->
<urlrewrite use-query-string="true">
?? ?<rule>
?? ??? ?<note>robots</note>
?? ??? ?<from>
?? ??? ??? ?^/robots.txt$
?? ??? ?</from>
?? ??? ?<to type="permanent-redirect">%{context-path}/static/robots.txt</to>
?? ?</rule>
??? <rule match-type="regex"> (这里有两个选项 regex 和 wildcard,即正则匹配和通配符匹配)
?? ??? ?<note>the content.do url redirect 阅读无章节</note>
?? ??? ?<from>^/content.do\?nid=([_0-9a-zA-Z]+)$</from>
?? ??? ?<to type="permanent-redirect">%{context-path}/content/$1</to>
?? ?</rule>

</urlrewrite>

红体字一会再做解释。这两条主要是把网站的Robots和小Logo做重写向,红体是表示 301永久重定向。

例如

倾国小说网(www.qgreading.com)的robots.txt 应用上面的配置 www.qgreading.com/robots.txt ---> www.qgreading.com/static/robots.txt

另外,我们也可以充分利用condition这个属性来区分浏览器或者终端进行条件跳转,最简单的,如果一个站即有WEB,也有WAP,我们可以利用User-Agent进行筛选,跳到不同的页面,或者设置不同的属性。一些WAP在区分手机型号时也很有用。

<rule>
<condition name=”user-agent”>Mozilla/3\.0 (compatible; AvantGo .*)</condition>
<from>.*</from>
<set name=”client”>AvantGo</set>
</rule>
<rule>
<condition name=”user-agent”>UP\.Browser/3.*SC03 .*</condition>
<from>.*</from>
<set name=”client”>Samsung SCH-6100</set>
</rule>

配置

只需要增加Rule规则

<rule>

??? <note>这里添加描述信息</note>

??? <from>这里写需要转变的URL,一般用正则匹配</from>

?? <to type="跳转的类型">转换后的URL路径</to>

</rule>

贴一下跳转的类型,一般不好找的哦,呵呵 ……^_^

?

forward:默认. 请求匹配这个<rule />的所有<condition />, 并且URL使用内部跳转到”to”指定的地址(注意, 这里forward 到的URL 必须和UrlRewriteFilter 位于同一个容器中)。状态码 302。临时重定向。

?

redirect:用Response.Redirect实现,请求匹配所有<condition />和这个<rule />的<from />, 通知客户端跳转到<to />指定地址,状态码应该是302。

?

permanent-redirect: 永久重定向。状态码301。相当于做了以下事情

????? response.setStatus(HttpServletResponse.SC_MOVED_PERMANENTLY);.

????? response.setHeader(“Location”, [<to />指定的值]);

?

passthrough: 和forward 相同,具体区别我也不清楚。

?

temporary-redirect:临时重定向。状态码302。 相当于做了以下事情
????? response.setStatus(HttpServletResponse. SC_MOVED_TEMPORARILY);
????? response.setHeader(“Location”, [<to />指定的值]);

?

再补充一些配置时候的问题和小技巧:

1. 在配置中如果要使用”&”, 用&amp;

2. 简单起见, 给<from />的配置前面和后面分别加上^, $, 这两个是正则表达式中的强制开始和结尾标志;

3. 如果使用<outbound-rule>要记得代码中的url都是编码过的;

4. contex 是非常重要的, 如果有一个应用的context 是”/myapp”, 并且你的请求是”/myapp/somefolder/somepage.jsp”, 容器交给UrlRewriteFilter 的url 会是”/somefolder/somepage.jsp”, 这可能难以理解, 但是在你的<rule>和<condition>中不要包含context path, 它是容器负责处理的.

5. 正则表达式非常复杂灵活, 请阅读java.util.regex.Pattern中的java正则介绍。如果觉得正则难以理解, 可以使用通配符方式。

6. 应用通配符,通配符匹配引擎可以替代正则表达式, 在<condition>和<rule>中设置match-type 是wildcard 用以开启支持通配符.(或者设置default-match-type)
例如:
/big/url/*匹配/big/url/abc.html但是不匹配/big/url/abc/dir/或/big/url/abc/
/big/url/**匹配/big/url/abc.html, /big/url/abc/dir/和/big/url/abc/
也可以和正则的替换一样, 每个*代表一个参数, 在<set>和<to>中用$N的方式使用

7. <to />可以是null, 意义为: 如果匹配请求不再继续, 相当于没有调用chain.doFilter

热点排行