作者说明:
- l- w7 q9 c; k! y% u3 Q1 g% L本文内容基本来自Apache2.0官方文档,并结合了作者的日常工作经验。事实上对于任何一项
开源技术来说,官方文档都是最好的技术资料,个人觉得网上90%的技术文档都可以在官方的技术文档中找到。不过很多人都没有意识到这一点,我想这和其中的大多数都没有中文版本有关。如果你在学习某项技术时遇到了问题,不妨先去其主站看看最新的官方文档。让我们一起为开源努力吧。
, V5 w4 o; j7 M7 S! u( y8 b
7 K1 U. _: ^7 Z) ~2 n- ?
一谈到Apache,相信大多数
系统管理员使用的还是其稳定版1.3——虽然2.0系列的开发版早已由Alpha,Beta发展到了现在的GA(GeneralAvailability)版,不过大家潜意识里还是认为开发中的版本并不是可用于生产
环境的稳定版本,尤其是1.3的API与2.0的不兼容而使得大量的模块必须要重写才能在2.0上用。坦白地说,这种担心并不是多余的,Apache1.3和2.0之间的内部变化实在是太大了(这一开发已经历了5年)。用Apache创始人BrianBehlendorf自己的话来说:“这个版本包括了数百个新的特性,所以这个产品可能应该具有3.1或者8i这样的产品编号,而不是2.0!”。
: D& z) W' T3 ^6 D& E% }. A
, {+ O1 Y" Y* r6 a( x在Apache2.0中加入了很多的核心改进和新
功能,如
Unix线程、多协议支持、新的构建系统、更好的支持非Unix平台、IPv6支持、新的ApacheAPI、过滤器、多语言错误响应、原生的
WindowsNTUnicode支持、更简单化的配置、以及升级了的正则表达式库等,当然还包括对许多模块的重要改进,同时也加入了一些新的模块。如此多的变化,会使得大多数Apache管理员在刚接触2.0时会不知所措,笔者也不例外。
. c4 I! O6 k- ]0 B0 h* x; [; M6 v3 ~
不过现在的情况有了很大变化,Apache开发团队做了很多工作使得从1.3升级到2.0更加平滑,同时很多重要的模块也已经很好地支持2.0了,如
PHP、FastCGI、Mod_perl、Mod_python等。在httpd.conf的指令配置语法上,目前的2.0版本(笔者写作时是2.0.46)和1.3版本的兼容性已做得相当好了(比如早期的2.0版本如果要使用PHP的话,一般是用过滤器,不过现在的PHP官方文档中已经使用1.3中的LoadModule语句做为加载PHP的推荐方式)。只要略微了解一下2.0的新特性,从1.3升级到2.0就是一件非常容易的事情了。毕竟使用Apache2.0是大势所趋,而且笔者个人感觉,Apache的开发团队已经把开发重心转移到2.0上(1.3自2002年10月发布了1.3.27后,至今没有新版本推出,而2.0却在与1.3.27同时发布2.0.43后在2003年1月发布了2.0.44,3月末发布了2.0.45,5月末发布了2.0.46,并包含了很多改进和修正)。
' R* H+ x7 e4 X
7 V7 l2 t# Z+ v5 p
尽管Apache2.0在许多方面有了不小的进步,但相信最吸引系统管理员的还是性能上的改善。毫不夸张地说,MPM(Multi-ProcessingModules,多道处理模块)的引入是Apache2.0最重要的变化。大家知道,Apache是基于模块化的设计,而Apache2.0更扩展了模块化设计到web
服务器的最基本功能。服务器装载了一种多道处理模块,它负责绑定本机
网络端口,接受请求并调度子进程来处理请求。扩展模块化设计到这个层次有两个重要好处:
! p6 X6 _+ n# {5 u! t3 E
1.Apache可以更简洁有效地支持多种
操作系统;
: w. c' u7 [8 p
2.服务器可以按站点的特殊需要进行自定制。
$ a2 N* y7 h( o8 E+ S( p% t& d* {: F0 W1 @. n
在用户级,MPM看起来和其他Apache模块非常
类似。主要区别是在任一时刻只能有一种MPM被装载到服务器中。
7 g3 e" U, Z% c' f8 _
/ M( R7 P+ A) s5 o在支持
POSIX线程的Unix系统上,Apache现在可以通过不同的MPM运行在一种多进程与多线程相混合的模式下,这就增强了许多(但不是所有)配置的可扩充性能。相比于Apache1.3,2.0版本作了大量的优化来提升处理能力和可伸缩性,并且大多数改进在默认状态下就可以生效。但是我不得不很遗憾的说在FreeBSD上基于线程的产品级MPMworker--还存在着很大的问题。这主要是因为FreeBSD自身的线程库还远远比不上
Linux和
Solaris成熟。
4 Q: _: ?3 @/ z) C2 G
9 e& K; O& l. }- u V9 C
在我实际的工作中,Linux和Solaris上使用workerMPM都运行得不错,性能确实有提高,虽然在Linux(
Redhat9)上出现过负载突然增大数倍时,Apache线程无法正常工作的情形,但发现主要原因还是配置参数过度优化,并加载了一些有冲突的模块,并不是Linux系统本身的问题。而Solaris9forSPARC是工作得最好的平台,可以完全按照笔者的配置工作,没有出现任何问题。
- ^+ c) Y* C' @+ {8 g
! W8 Y$ r! g+ m, Y; U+ P6 s
下面我以FreeBSD4.8为平台,说明在Apache2.0中如何指定MPM。先解压缩
源代码包httpd-2.0.46.tar.gz生成httpd-2.0.46目录,(BTW:Apache1.3源代码包的命名规则是apache_1.3.NN.tar.gz,而2.0则是httpd-2.0.NN.tar.gz——其中NN是次版本号)。
; v5 }# H+ i( B3 X/ E- r+ q0 o
1 X3 y3 ?* D( b$ m
进入httpd-2.0.46录,运行:
% E* b* Z1 \0 P7 c7 j
, L. H9 x5 l4 |7 l$ M
./configure--help│grepmpm
$ Q, ^! [4 M( Y: E
会显示
! K$ \2 f: o% [9 X--with-mpm=MPMChoosetheprocessmodelforApachetouse.
, o$ K# \4 G, Y# c: Q+ s
MPM={beos│worker│prefork│mpmt_os2│perchild│leader│threadpool}
' p6 C8 k' v1 C7 @
这里就是用来选择要使用的进程模型,也就是哪种MPM模块。beos,mpmt_os2分别是BeOS和OS/2上的缺省MPM,perchild的主要设计目的是以不同的用户和组的身份来运行不同的子进程,这在运行多个需要CGI的
虚拟主机时特别有用,Apache官方文档说它会比1.3中的SuExec机制做的更好。leader和threadpool都是基于worker的变体,还处于实验性阶段,某些情况下并不会按照预期设想的那样工作,所以Apache官方也并不推荐使用。(有关其他的MPM的详细说明,请参见Apache官方文档:http://httpd.apache.org/docs-2.0/mod/)。
) t0 S0 K/ \( k, }3 l, \& [" S
; r' l' O( Y$ b& |1 D+ y& e
如果不用--with-mpm显式指定某种MPM的话,那么prefork就是Unix平台上的缺省MPM.它所采用的方式是预派生子进程的方式,这事实上也就是Apache1.3中所采用的模式。它本身并没有使用到线程,2.0使用它是为了与1.3保持兼容性,另一方面,prefork用单独的子进程来处理不同的请求,进程之间是彼此独立的,这也使得它成为最稳定的MPM.对比prefork,worker是2.0中全新的支持多线程和多进程混合模型的MPM。由于使用线程来处理请求,所以,可以处理相对海量的请求,而系统资源的开销小于基于进程的服务器。但是,它也使用了多进程,每个进程又生成多个线程,以获得基于进程的服务器的稳定性。笔者认为这种MPM的工作方式将是Apache2.0以后的发展趋势。
- E: a( j( |. G9 U1 B8 _# ^5 c2 _. T, ~* t. Q: w/ T/ _
若使用prefork,在make编译和makeinstall安装后,使用httpd–l来确定当前使用的MPM,应该会看到prefork.c(如果看到worker.c就说明使用的是workerMPM,依此类推)
1 P7 ]. f8 X8 Y1 L) o
8 t" z, C. x2 a: J3 k注意:不象在Linux和Solaris,在FreeBSD上用正常方式--with-mpm=worker是无效的!!即使这么做在安装后也只能看到prefork.c即prefork模式!!如果你细心的话在configure过程中你会看到
& [ M+ J% _; _% y5 E, s& l$ Q
7 a" n3 h2 Y' }$ ^9 \7 [2 UApplyingAPRhintsfilerulesfori386-unknown-freebsd4.8
/ w4 d# q i4 M& u* G! gsettingenable_threadsto"no"
& i: M$ n1 Q$ K, k, M
APRwillbenon-threaded
, x& _# K# ] w% I' h' P
ThecurrentlyselectedMPMrequiresthreadswhichyoursystemseemstolack
+ f& R! `! R) B* y% v6 L0 W- y. ]% F9 [
不过这并不说明一定不能在FreeBSD上使用线程,其实在configure时有个未公开的选项--enable-threads,它在configure--help时是看不到的。显式加上它就可以以workerMPM来配置编译Apache2.0了,但是虽然编译没有问题,可是Apache起动后根本无法正常工作,
浏览器会一直等待回应(在FreeBSD4.8,5.1上均不行),个人认为FreeBSD在高端还有很长的路要走,线程,PAE,SMP--虽然5.1有了不小的改进但仍然不是十分完善。
4 r- M2 v. {" b2 q J
' X: e( k' {$ t- d* c. S+ B6 X因此,对于FreeBSD来说,prefork几乎还是目前的唯一MPM,我在下面主要还是讨论它的工作原理和相关指令调整。
' [8 O, @# W! R: @# ^' O7 e9 X7 s
查看缺省生成的httpd.conf配置文件,会发现里面包含如下的配置段:
( r/ F' X3 i) t" y
, v) C7 f/ N# r# C
%26lt;IfModuleprefork.c%26gt;
. n3 _- P' C% S$ ?
Start
Servers5
+ A" u5 h& @$ N2 k
MinSpareServers5
4 C9 i: z: I3 {4 i) J
MaxSpareServers10
+ t& \" |: n8 x* b T, Y' f) f
MaxClients150
0 A# s j# s0 Y8 C
MaxRequestsPerChild0
0 T$ P" N. Q# z3 d% @$ t8 x%26lt;/IfModule%26gt;
" Q, G5 o9 A7 q
prefork的工作原理是这样的:控制进程在最初建立StartServers个子进程后,为了满足MinSpareServers设置的需要,创建一个进程,等待一秒钟,继续创建第二个,等待一秒钟,继而创建四个,如此按指数级增加创建的进程数,最多达到每秒32个,直到满足MinSpareServers设置的值为止,这也就是预派生(prefork)的由来。这种模式可以使得不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。
. J* { B, g) K4 s. [8 u
7 X6 K, A# G# \, [4 o
MaxSpareServers设置了最大的空闲进程数,如果空闲进程数大于这个值,Apache会自动kill某些多余进程。这个值一般不要设的过大,但如果设的比MinSpareServers小,Apache会自动把它调整为MinSpareServers+1。如果站点负载较大的话,可考虑同时加大MinSpareServers和MaxSpareServers。
5 D# @) }1 \+ \$ h8 S: h" a+ I5 @MaxRequestsPerChild设置的是每个子进程可以处理的请求数。每个子进程在处理了MaxRequestsPerChild个请求后将自动销毁。0意味着无限,即子进程永不销毁。虽然缺省设为0可以使每个子进程处理更多的请求,但如果设成非零值也有两点重要的好处:
0 F5 |) j' O/ M0 e9 v$ D$ z4 n1.可防止意外的
内存卸漏;
2 D& c9 F6 v/ j2 g& Q/ o, T5 K% S g2.在服务器负载下降的时侯会自动减少子进程数。
5 _ K; @: u I4 P: s( Y p! h
! u# X, t& {% F$ q因此,可根据服务器的负载来调整这个值,如果非零的话,笔者认为10000左右是比较合适的。事实上这个值对Apache的性能影响不是很大。
$ F- Z2 k- J2 c! I" b! ]
. E Q% f0 m/ `- ]
MaxClients是这些指令中最为重要的一个,它设定的就是Apache可以同时处理的请求,这是对Apache性能影响最大的参数.在我个人看来,缺省的150是远远不够的,如果请求总数已达到这个值(可通过ps–ef│grephttpd│wc–l来确认),那么下面的请求就要排队,直到某个已处理请求完毕。这就是为什么系统资源还剩下很多,而http访问却很慢的主要原因。系统管理员可以根据
硬件配置和负载情况来动态调整这个值,虽然
理论上这个值越大,可以处理的请求就越多,但Apache默认的限制是不能大于256。如果把这个值设为大于256那么Apache将无法起动。事实上,256对于负载稍重的站点也是很不够的。在Apache1.3中这是个硬限制,如果要加大这个值,必须在configure前手工修改源代码树下的src/include/httpd.h,查找256,会发现#defineHARD_SERVER_LIMIT256这行,把256改为你要增大的值如4000,然后重新编译Apache即可。我想这个方法稍有些经验的Apache系统管理员都知道,不过我相信在Apache2.0中知道如何加大这个值的人就不会太多了。
2 `" O$ V! F& _7 m) T8 u
& P- M) Z2 X" f, |0 V+ u在Apache2.0中新加入了ServerLimit指令,使得无须重编译Apache就可以加大MaxClients。下面是笔者的prefork配置段。
; ]$ Q7 C+ s! @+ a$ Y; d2 T3 v+ x: ^$ S" b1 I. f
%26lt;IfModuleprefork.c%26gt;
l; p K: T( n2 pStartServers10
% p, ?! o0 j$ g+ R# I1 l1 g
MinSpareServers10
7 y+ @# B) l X+ s' Q% X# f8 cMaxSpareServers15
% M+ O1 W# F+ d g9 p" E9 eServerLimit2000
. {5 s, Z( J( |6 D# CMaxClients1500
1 h8 a# a+ N) ~" }) A, L. D7 dMaxRequestsPerChild10000
6 s- s* D! m: ~* K, z- r1 q%26lt;/IfModule%26gt;
& ]+ {; e& D) x1 C7 }$ mBTW:ServerLimit的最大值是20000,这对于大多数站点是足够了,但如果你一定要再加大的话,那么这个值位于源代码树下的server/mpm/prefork/prefork.c中。里面的
3 h& T! Y5 O1 Q8 U& r
#defineDEFAULT_SERVER_LIMIT256
( Q U( h; E3 j& x" p3 Z0 e
#defineMAX_SERVER_LIMIT20000
' h3 n& z5 t% V, P ]
这两行就对应着MaxClients和ServerLimit的限制值。但我相信很少有人可以用到20000的并发连接数。
' x& @/ K/ P" r# U' N如果你有耐性看完了我这篇文档,我相信您对Apache2.0缺省的prefork的工作原理有所熟悉了,理解了它的工作过程后,就可以根据您的实际情况在FreeBSD下来配置Apache相关的核心参数以获得最大的性能。当然---在Apache2.0中还有不少以功能换取
速度的指令,如HostnameLookups等,这就不在本文的叙述范围里了,有兴趣的读者可以去看Apache官方文档,(还有别忘了用strip去掉httpd中的多余符号,这点很容易被人遗忘,其实会使httpd大小大约减少30-50%!!从而使你的Apache更快!)另外如果您是Linux和Solaris系统管理员,想要使用workerMPM的话,请参见http://httpd.apache.org/docs-2.0/mod/worker.html,还是老话,多看看官方文档吧。
+ l# B0 [7 ?2 M Y
! R; z$ O7 q9 }# V4 y
& a5 A+ G2 p, d; f/ ? d' k D0 }* r B u- q+ [; }; t* i
9 k3 O! p8 M3 ^6 z# r" Y' c
注:任何转载或摘抄请务必保留作者
信息和注明文章出处%26lt;http://www.cnfug.org%26gt;