Apache Rewrite设置

来源:互联网 发布:自制51单片机最小系统 编辑:程序博客网 时间:2024/06/10 07:10

一、Apache 域名的重定向

简单的说就是配置Apache让它自动把旧的URL地址转换成新的URL输出。 

  • 首先,apache重定向功能需要调用mod_rewrite模块,由于apache2.2的modules文件夹中带有该模块,所以我们只需开启http.conf文件中的LoadModule rewrite_module modules/mod_rewrite.so(去掉前面的‘#’就可以了)。

 Apache模块 mod_rewrite说明

说明:提供了一个基于规则的实时转向URL请求的引擎状态:Extension模块名:rewrite_module源文件:mod_rewrite.c兼容性:包含在Apache 1.3及其更新版本中      

  • 修改http.conf文件,追加以下代码:
#开启Rewrite模块
RewriteEngine on  
#设置Log的输出位置()
RewriteLog 
"F:/local/apache2.2/logs/rewrite.log"
  
#举例:替换page.jsp?id
=
30800为新地址http://localhost/webadmin/index.jsp 
RewriteCond %{QUERY_STRING} ^id
=30800
$       
RewriteRule ^/page.jsp$ http://localhost/webadmin/index.jsp 
[L]

常用指令:

  • RewriteBase

语法:RewriteBase URL-path

RewriteBase指令显式地设置了目录级重写的基准URL。默认值是,RewriteBase physical-directory-path在对一个新的URL进行替换时,此模块必须把这个URL重新注入到服务器处理中。 为此,它必须知道其对应的URL前缀或者说URL基准。通常,此前缀就是对应的文件路径。 但是,大多数网站URL不是直接对应于其物理文件路径的,因而一般不能做这样的假定! 所以在这种情况下,就必须用RewriteBase指令来指定正确的URL前缀。

RewriteEngine On

#  let the server know that we were reached via /xyz and not
#  via the physical path prefix /abc/def
RewriteBase   /xyz
  • RewriteCond

 语法:RewriteCond TestString CondPattern

RewriteCond指令定义了一个规则的条件,即,在一个RewriteRule指令之前有一个或多个RewriteCond指令。 条件之后的重写规则仅在当前URI与pattern匹配并且符合这些条件的时候才会起作用。

TestString是一个纯文本的字符串,但是还可以包含下列可扩展的成分。CondPattern是条件pattern, , 一个应用于当前实例TestString的正则表达式, TestString将会被计算然后与CondPattern匹配.

RewriteCond  %{HTTP_USER_AGENT}  ^Mozilla.*
RewriteRule  ^/$                 /homepage.max.html  
[L]

RewriteCond  %{HTTP_USER_AGENT}  ^Lynx.*
RewriteRule  ^/$                 /homepage.min.html  
[L]

RewriteRule  ^/$                 /homepage.std.html  
[L]

 

  • RewriteEngine

 语法:RewriteEngine on|off

RewriteEngine指令打开或关闭运行时刻的重写引擎。 如果设置为off,则此模块不执行任何运行时刻的重写操作, 甚至也不更新SCRIPT_URx环境变量。使用该指令可以使此模块无效,而无须注释所有的RewriteRule指令!

注意:默认情况下,重写配置是不可继承的, 即,必须在每个需要的虚拟主机中设置一个RewriteEngine on指令。

  • RewriteLog

语法:RewriteLog file-path

RewriteLog指令设置用于记录所有重写操作的文件的名称。 如果此文件名不是以斜杠('/')开头,则它是相对于Server Root的。 此指令应该仅仅出现在服务器级配置中。

如果要关闭对重写操作的记录,不推荐把Filename设置为/dev/null, 因为,虽然重写引擎不能输出记录了,但仍会内部地建立这个日志文件, 它会使服务器速度降低,而且对管理员毫无益处! 要关闭日志,可以删除或注解RewriteLog指令, 或者使用RewriteLogLevel 0!
RewriteLog "/usr/local/var/apache/logs/rewrite.log" 
  • RewriteLogLevel

语法:RewriteLogLevel Level

RewriteLogLevel指令设置重写引擎日志的详细程度的级别。 默认级别0意味着不记录,而9或更大的值意味着记录所有的操作。

要关闭重写引擎日志,可以简单地设此值为0,关闭所有的重写操作记录。使用较高的Level值会使Apache服务器速度急剧下降! 重写日志使用大于2的Level值只用于调试!

RewriteLogLevel 3
  • RewriteRule

语法:RewriteRule Pattern Substitution

RewriteRule指令是重写引擎的根本。此指令可以多次使用。 每个指令定义一个简单的重写规则。这些规则的定义顺序尤为重要, 因为,在运行时刻,规则是按这个顺序逐一生效的.

Pattern是一个作用于当前URL的兼容perl的正则表达式. 这里的``当前''是指该规则生效时的URL的值。 它可能与被请求的URL不同,因为其他规则可能在此之前已经发生匹配并对它做了改动。

[flags]

  • 'redirect|R [=code]' (强制重定向 redirect)
    http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的),permanentseeother. 用它可以把规范化的URL反馈给客户端,, 重写``/~''为 ``/u/'',或对/u/user加上斜杠,等等。

    注意: 在使用这个标记时,必须确保该替换字段是一个有效的URL! 否则,它会指向一个无效的位置! 并且要记住,此标记本身只是对URL加上 http://thishost[:thisport]/的前缀,重写操作仍然会继续。 通常,你会希望停止重写操作而立即重定向,则还需要使用'L'标记.

  • 'forbidden|F' (强制URL为被禁止的 forbidden)
    强制当前URL为被禁止的,,立即反馈一个HTTP响应代码403(被禁止的)。 使用这个标记,可以链接若干RewriteConds以有条件地阻塞某些URL。
  • 'gone|G' (强制URL为已废弃的 gone)
    强制当前URL为已废弃的,,立即反馈一个HTTP响应代码410(已废弃的)。 使用这个标记,可以标明页面已经被废弃而不存在了.
  • 'proxy|P' (强制为代理 proxy)
    此标记使替换成分被内部地强制为代理请求,并立即(, 重写规则处理立即中断)把处理移交给代理模块。 你必须确保此替换串是一个有效的(比如常见的以 http://hostname开头的)能够为Apache代理模块所处理的URI。 使用这个标记,可以把某些远程成分映射到本地服务器名称空间, 从而增强了ProxyPass指令的功能。

    注意: 要使用这个功能,代理模块必须编译在Apache服务器中。 如果你不能确定,可以检查``httpd -l''的输出中是否有mod_proxy.c。 如果有,则mod_rewrite可以使用这个功能; 如果没有,则必须启用mod_proxy并重新编译``httpd''程序。

  • 'last|L' (最后一个规则 last)
    立即停止重写操作,并不再应用其他重写规则。 它对应于Perl中的last命令或C语言中的break命令。 这个标记可以阻止当前已被重写的URL为其后继的规则所重写。 举例,使用它可以重写根路径的URL('/')为实际存在的URL, 比如, '/e/www/'.
  • 'next|N' (重新执行 next round)
    重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。 它对应于Perl中的next命令或C语言中的continue命令。 此标记可以重新开始重写操作,, 立即回到循环的头部。
    但是要小心,不要制造死循环!
  • 'chain|C' (与下一个规则相链接 chained)
    此标记使当前规则与下一个(其本身又可以与其后继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, ,这个标记不起作用;如果规则不能被匹配, 则其后继的链接的规则会被忽略。比如,在执行一个外部重定向时, 对一个目录级规则集,你可能需要删除``.www'' (此处不应该出现``.www''的)。
  • 'type|T=MIME-type' (强制MIME类型 type)
    强制目标文件的MIME类型为MIME-type。 比如,它可以用于模拟mod_alias中的ScriptAlias指令, 以内部地强制被映射目录中的所有文件的MIME类型为``application/x-httpd-cgi''.
  • 'nosubreq|NS' (仅用于不对内部子请求进行处理 no internal sub-request)
    在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。 比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用, 它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。

    根据你的需要遵循以下原则: 如果你使用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理, 而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。

  • 'nocase|NC' (忽略大小写 ncase)
    它使Pattern忽略大小写,, 在Pattern与当前URL匹配时,'A-Z' 和'a-z'没有区别。
  • 'qsappend|QSA' (追加请求串 query string append)
    此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。
  • 'noescape|NE' (在输出中不对URI作转义 no URI escaping)
    此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(如'%', '$', ';'等)会被转义为等值的十六进制编码。 此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,如:

    RewriteRule /foo/(.*) /bar?arg=P1/%3d$1 [R,NE]

    可以使'/foo/zed'转向到一个安全的请求'/bar?arg=P1=zed'.
  • 'passthrough|PT' (移交给下一个处理器 pass through)
    此标记强制重写引擎将内部结构request_rec中的uri字段设置为 filename字段的值,它只是一个小修改,使之能对来自其他URI到文件名翻译器的 AliasScriptAliasRedirect 指令的输出进行后续处理。举一个能说明其含义的例子: 如果要通过mod_rewrite的重写引擎重写/abc/def, 然后通过mod_alias使/def转变为/ghi,可以这样:

    RewriteRule ^/abc(.*) /def$1 [PT]
    Alias /def /ghi

    如果省略了PT标记,虽然mod_rewrite运作正常, , 作为一个使用API的URI到文件名翻译器, 它可以重写uri=/abc/...filename=/def/..., 但是,后续的mod_alias在试图作URI到文件名的翻译时,则会失效。

    注意: 如果需要混合使用不同的包含URI到文件名翻译器的模块时, 就必须使用这个标记。。 混合使用mod_aliasmod_rewrite就是个典型的例子。

    For Apache hackers

    如果当前Apache API除了URI到文件名hook之外,还有一个文件名到文件名的hook, 就不需要这个标记了! 但是,如果没有这样一个hook,则此标记是唯一的解决方案。 Apache Group讨论过这个问题,并在Apache 2.0 版本中会增加这样一个hook。
  • 'skip|S=num' (跳过后继的规则 skip)
    此标记强制重写引擎跳过当前匹配规则后继的num个规则。 它可以实现一个伪if-then-else的构造: 最后一个规则是then从句,而被跳过的skip=N个规则是else从句. (它和'chain|C'标记是不同的!)
  • 'env|E=VAR:VAL' (设置环境变量 environment variable)
    此标记使环境变量VAR的值为VALVAL可以包含可扩展的反向引用的正则表达式$N%N。 此标记可以多次使用以设置多个变量。 这些变量可以在其后许多情况下被间接引用,但通常是在XSSI (via <!--#echo var="VAR"-->) or CGI ( $ENV{'VAR'})中, 也可以在后继的RewriteCond指令的pattern中通过%{ENV:VAR}作引用。 使用它可以从URL中剥离并记住一些信息。
  • 'cookie|CO=NAME:VAL:domain[:lifetime[:path]]' (设置cookie)
    它在客户端浏览器上设置一个cookie。 cookie的名称是NAME,其值是VAL。 domain字段是该cookie的域,比如'.apache.org', 可选的lifetime是cookie生命期的分钟数, 可选的path是cookie的路径。

实例

假设如果要把访问的域名www.domain1.com的域名转发到 www.domain2.com 上。实现:在相关的虚拟主机中增加

########
RewriteEngine on      
RewriteCond %{HTTP_HOST} ^www.domain1.com$
RewriteRule ^/(.*)$  http://www.domain2.com/$1 [R=301,L]

②如果是多个域名重定向到一个域名
########
RewriteEngine on      
RewriteCond %{HTTP_HOST} ^www.domain.com [OR]
RewriteCond %{HTTP_HOST} ^www.domain1.com$
RewriteRule ^/(.*)$  http://www.domain2.com/$1 [R=301,L]


Apache Rewrite 重定向问题汇总

apache 的 rewrite模块 用了也有段时间了。每次都是先从历史中找资料修改。今天腾出点时间整理下和大家分享一下,其实rewrite规则超多,我也没有全部理解,实践中我用的一些列出来,相信一般应用的朋友足够了

为什么需要用重写规则?

他人总结:

一个网站,如果是长期需要放在internet上提供服务,必定会有不断地更新和维护,如临 时转移到其它服务器进行维护,重新组织目录结构,变换URL甚至改变到新的域名等等, 而为了让客户不会因此受到任何影响,最好的方法就是使用Apache Rewrite Rule(重写 
规则)。

当在浏览器的地址栏输入一个无效的参数时,会出现数据库的错误提示,这是一个安全的隐患

搜索引擎无法收录你的所有网页

网页的链接地址是一系列的参数,对浏览用户和搜索引擎都不易理解

我的总结:

rewrite可以保持接口的固定稳定性,防止图片盗链,增加搜索引擎的爬去机会,同事还能给人深不可测的感觉(猜不透你用的后端是什么技术和语言写的)

常见的Dz论坛就喜欢这样干,优化了搜索引擎,有看上去静态话给人一种高深的感觉:

  RewriteRule ^(.*)/archiver/((fid|tid)-[\w\-]+\.html)$ $1/archiver/index.php?$2
  RewriteRule ^(.*)/forum-([0-9]+)-([0-9]+)\.html$ $1/forumdisplay.php?fid=$2&page=$3

配置

我这里用的是apache2的模块,IIS中也可以配置,相信原理基本类似。

在httpd.conf里定义LoadModule rewrite_module modules/mod_rewrite.so

虚拟主机配置中定义 具体的rewrite规则。

这里相信大家都熟悉,我就不说了


Apache的RewriteRule规则详细介绍:

R[=code](force redirect) 强制外部重定向

F(force URL to be forbidden)禁用URL,返回403HTTP状态码。

G(force URL to be gone) 强制URL为GONE,返回410HTTP状态码。

P(force proxy) 强制使用代理转发。 )

L(last rule) 表明当前规则是最后一条规则,停止分析以后规则的重写。 
N(next round) 重新从第一条规则开始运行重写过程。 
C(chained with next rule) 与下一条规则关联 
如果规则匹配则正常处理,该标志无效,如果不匹配,那么下面所有关联的规则都跳过。

T=MIME-type(force MIME type) 强制MIME类型 
NS (used only if no internal sub-request) 只用于不是内部子请求

NC(no case) 不区分大小写 
QSA(query string append) 追加请求字符串

NE(no URI escaping of output) 不在输出转义特殊字符

例如:RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE] 将能正确的将/foo/zoo转换成/bar?arg=P1=zed +3a?` Z 
PT(pass through to next handler) 传递给下一个处理

例如: :5/Uh/ sX 
RewriteRule ^/abc(.*) /def$1 [PT] # 将会交给/def规则处理

S=num(skip next rule(s)) 跳过num条规则

E=VAR:VAL(set environment variable) 设置环境变量

我们从实战中获得些实用的实例:

简单的虚拟主机配置:


     DocumentRoot E:\JAVA_WorkSpace\bsei_mapenjoy_passport_tomcat\WebRoot
     ServerName 
www.boshilian.com
     ErrorDocument 404   /index.html
     
     RewriteEngine On
     RewriteRule /22.htm(.+)$ /help.jsp?$1 [L]
     RewriteRule /33.htm(.+)$ /help.jsp?$1 [R]
     RewriteRule /44.htm(.+)$ 
http://www.sohu.com?$1 [L]
     RewriteRule /55.htm(.+)$ 
http://www.sohu.com?$1 [R]

     RewriteRule /66.htm(.+)$ http://www.sohu.com?$1 [P]

     RewriteCond %{QUERY_STRING} ^t\=(.+)?$ [NC]
     RewriteRule ^/api$ 
http://www.sina.com.cn?t=%1 [P]


最简单的重定向:

下面列一下常用简单的,相信大家都熟悉,我就简单列一下:

url不发生变化,直接定向,类似于java中的forword:

RewriteRule /22.htm(.+)$ /help.jsp?$1 [L]

url发生变化,直接定向,redirect转向,(支持跨域):
RewriteRule /33.htm(.+)$ /help.jsp?$1 [R]

RewriteRule /44.htm(.+)$ http://www.sohu.com?$1 [L]
RewriteRule /55.htm(.+)$ 
http://www.sohu.com?$1 [R]

问题汇总(关键在这)

一般遇到2类问题居多,下面做解决的陈述:

apache+tomcat Rewrite遇到的问题,又跨域,又要url不变的重定向


这里我遇到了一个问题,就是我用apache + tomcat配置整合的时候, apche对于tomcat的重定向目录解析不正确,rewrite始终认为哪个目录为apache下的。如果用跨域的跳转(全域名的),url就会发生变化。这样不太爽。

我们可以用以下方法解决:(这样浏览器中的url还是66.htm , 但是内容已经是sina的了)

RewriteRule /66.htm$  http://www.sina.com.cn [P]

RewriteRule /66.htm$  http://127.0.0.1:8080/sohu/sd.jsp [P]

注意:这里的P是代理模式转发,必须用url全称,并且要保证modProxy打开,也就是下面httpd.conf中的着两句:

LoadModule proxy_module modules/mod_proxy.so
LoadModule proxy_http_module modules/mod_proxy_http.so

如果不打开则会出现403禁止页面。

rewrite重定向中的?问号参数问题

rewrite前面的参数的?是不能发送的,需要处理一下

http://www.boshilian.com/api?t=2323&v=23232&nond=323we

rewrite为:

http://www.sina.com.cn?t=2323&v=23232&nod=323we

配置写法如下:(url不变)

RewriteCond %{QUERY_STRING} ^t\=(.+)?$ [NC]
RewriteRule ^/api$ 
http://www.sina.com.cn?t=%1 [P]

或者(url变化)

RewriteCond %{QUERY_STRING} ^t\=(.+)?$ [NC]
RewriteRule ^/api$ 
http://www.sina.com.cn?t=%1 [L]

这样就可以把?后面的 t 参数转发过去。

 

官方文档解释为:
注意:查询字符串
Pattern 不会按照查询字符串进行匹配。为了达到这个目的,你必须使用一个带有 %{QUERY_STRING} 变量的 RewriteCond 指令。

当 然,你也可以在替换字符串中创建包含查询字符串的 url:在替换字符串中使用问号,以标明其后的部分应该被重新注入到QUERY_STRING中。

而要删除一个已有的请求串,则可以用问号来终结替换字符串。为了联合新旧查询字符串,请使用[QSA]标志。

先写这么多,rewrite还有很多参数组合的应用,我这里先不介绍,应用深入这可以一起留言讨论。



原创粉丝点击