tomcat剖析
uml参考:
http://www.yongfa365.com/Item/UML-Association-Dependency-Aggregation-Composition-Realization-Generalization.html
1 tomcat模块结构
?
1.1 Connector
在tomcat运作工作中,connector是最核心的模块,是tomcat的网络通讯层,是http协议的服务器实现载体。
它在tomcat中起到了承上启下的作用,对下实现http协议,封装网络通讯细节。对上构造javax.servlet.http.HttpServletRequest和javax.servlet.http.HttpServletResponse,为实现servlet规范提供两大基础对象。
?
以下是connector模块的核心类图,connector左侧的类主要负责http协议的实现,网络通讯功能。按照使用的通信技术的不同,可以分为JIO(经典的java socket实现),NIO(java的nio包,多路复用的反应器模式实现,性能上会有提高),还有apr(通过直接调用本地代码来实现基于平台的更高性能的网络通信)。
如果应用部署的方式是web server(例如apache)+servlet容器的话,那么还会使用定向包协议AJP。用户的请求会先到web server,web server在通过AJP将请求转发给servlet容器,AJP协议会以长连接的方式保持web server和servlet 容器的TCP连接。
?
Connector右边的类叫做适配器,顾名思义,这边的适配器充当的是Connector模块和Container模块的桥梁,Connector通过Adapter.service(Request req, Response res)将封装好的request和response实例传递给Container。
?
1.2 Container
容器是servlet的容器,servlet规范的实现。容器的作用是为servlet处理请求,生成响应。
容器总共有四种类型,并为层级结构,上层容器可能包含一个或者多个下层容器。
Engine:最上层的容器,表示整个catalina引擎。
Host:表示一个虚拟主机,它可以包含0个或多个Context.
Context:则是对应一个web应用,包含一个或者多个wrapper.
Wrapper:表示一个独立的servlet。最底层容器,不能再由子容器。
每个容器都有一个标准的实现类。
?
容器的运作机制是基于管道的,这是一种高度可扩展,可定制的一种流程处理方式。用户可以自定义valve,组装到pipeline,流水线般的处理请求。
?
核心类图
?
?
2 tomcat运作
2.1 启动
tomcat的启动主要由Bootstrap和catalina完成的。
?
tomcat的启动入口是Bootstrap的main函数,然后开始逐层传递start调用。
?
Bootstrap:初始化的时候 第一步是初始化自定义的classloader。之所以自定义class loader,一方面是为了安全隔离,每个servlet只能访问到各自WEB-INF/classes里的,防止恶意servlet访问其他context的对象;另一方面是为了支持一些个性化的需求,比如热部署,支持类文件修改自动感知和重新动态加载。第二步是通过反射实例化Catalina,传递start调用。
Catalina:catalina用于解析tomcat配置文件server.xml,配置文件可以自定义tomcat的各种特性,据此启动Server.
Server:server是统领全局的组件,它包含tomcat所有的功能组件,并负责所有组件的启动和停止。它关联了0个或多个service。
Service: service是container和connector的组合体,一般包含了一个container、1个或者多个connector。
它主要用于启动关联的container和connector,这两个核心组件一旦启动成功,tomcat就可以开始处理http请求了。
Container:启动自己,和关联的管道、阀门;并级联的启动子容器。
Connector:以JIO为例,经典版的socket通信。最后是启动了接收线程,用于接收客户端连接。
?
在tomcat的启动过程中(以及其他生命周期),各个组件的交互是通过观察者模式(监听器模式)来实现的,在松耦合的前提下,完成了组件间的灵活协作。核心类图:
?
?Lifecycle生命周期为要监听的对象,LifecycleListener为监听器。监听器会先注册感兴趣的组件对象,调用Lifecycle.addLifecycleListener(LifecycleListener listener)。当Lifecycle发生状态变化时,遍历调用所有监听器的LifecycleListener.lifecycleEvent(LifecycleEvent event),以此完成组件协作。
?
?
2.2 请求处理
以JioEndpoint和HTTP11Protocol为例。
?
JioEndpoint是基于java io实现,它启动一个接收器线程接收客户端连接,每当完成一个tcp连接时,便会创建一个socket工作线程,交由线程池处理。Endpoint模块主要的关注点是IO机制,经典io、nio或者apr,以及服务端多线程机制。而Protocol模块则是关注与http协议本身的逻辑,http请求的解析处理。当protocol完成http请求解析,将httprequest传递到container模块,这边则是进入了servlet规范的逻辑实现。
?
在container的处理过程中,一大特色就是pipeline机制(目前webx也采用了这样的方式)。pipeline由多个valve组成。tomcat用pipeline将多级容器的处理过程衔接起来,同时又支持用户自己开发valve,将自定义valve装配到pipeline中。
如下图所示每级的容器都关联了自己的一个pipeline,这个pipeline上设置了一个标准valve作为基础阀门,这个基础阀门一般是在管道的末尾,最后调用。
?容器的级联调用就是通过pipeline的基础阀门实现的。如下图,每一级容器会先调用pipeline,顺序执行设置的valve,最后再执行基础valve也就是各自的标准valve,由标准valve将调用传递到子容器。直至到StandardWrapperValve.invoke(),这个是最底层的容器,由它调用filter,最终执行servlet.service()。
?
?
?
?
?
?
?