Webwork 文件上传的问题
今天遇到一个webwork文件上传的问题,上传 txt 文件的时候,如果文件内容为空,则上传后的文件为null,上传不成功。试了一下,如果给txt文件写一个二进制的0x00字符,即可以上传成功,如果是上传一个没有内容的word文档,也可以成功,分析原因应该是word格式自带了很多隐藏格式数据,所以其实没有文字内容的word文档也是有东西的。这样看来,只要文件实际内容为空,即不带任何字符,上传就有问题。
随后,我查看了一下webwork.properties文件,发现我们项目的webwork.multipart.parser选用的是jakarta,于是我依次换用了另外两种parser:pell和cos。最后发现,只有cos不会出错,能够上传成功。看来,是具体parser对上传文件流的解析不一样。
三种parser都是市面上早已存在的,webwork只不过是对它们进行了封装调用,并不是靠自己来实现的。webwork提供了一个通用的访问接口MultiPartRequest,然后针对三种parser,分别继承实现了CosMultiPartRequest、PellMultiPartRequest、JakartaMultiPartRequest。默认情况下,如果你不在webwork.properties文件中设置parser,webwork会选择pell作为parser。
三种parser的区别是:只有Jakarta能做多文件的同时上传;只有pell能自动支持中文名文件的上传,其他两种需要你自己手动做encoding;cos功能比较强大,比如我上面提到的txt文件内容为空,cos可以上传成功,但其他两种parser就不行,不过webwork的封装使它丧失了很多功能。
另外,webwork.properties文件里还有其他几个与文件上传相关的参数,比如webwork.multipart.saveDir用于设定上传文件的临时文件保存目录,webwork.multipart.maxSize用于设置上传文件的最大字节数。
我又上网找了一篇文章,深入介绍了webwork文件上传的机制和过程,还找了一篇剖析webwork源码的pdf《Anatomy Webwork Source Code》,大家可以去下载看看 http://public.iecn.net/Along/Anatomy%20Webwork%20Source%20Code_V0.9.pdf。
那篇深入介绍Webwork文件上传机制的文章(http://www.wangchao.net.cn/bbsdetail_267965.html)如下:
点击上传按钮后,webwork的程序流如下:
step 1)进入ServletDispatcher.service
public void service(HttpServletRequest request, HttpServletResponse response) throws ServletException {
........
request = wrapRequest(request);
.........
}
step2)进入ServletDispatcher.wrapRequest
protected HttpServletRequest wrapRequest(HttpServletRequest request) throws IOException {
........................
if (MultiPartRequest.isMultiPart(request)) {
request = new MultiPartRequestWrapper(request, getSaveDir(), getMaxSize());
}
return request;
}
step3)进入MultiPartRequestWrapper的构造方法
public MultiPartRequestWrapper(HttpServletRequest request, String saveDir, int maxSize) throws IOException {
.....................
//step3.1)获取webwork.preperties配置的parser
String parser = "";
parser = Configuration.getString("webwork.multipart.parser");
// If it's not set, use Pell
if (parser.equals("")) {
log.warn("Property webwork.multipart.parser not set." +
" Using com.opensymphony.webwork.dispatcher.multipart.PellMultiPartRequest");
parser = "com.opensymphony.webwork.dispatcher.multipart.PellMultiPartRequest";
}
// legacy support for old style property values
else if (parser.equals("pell")) {
parser = "com.opensymphony.webwork.dispatcher.multipart.PellMultiPartRequest";
} else if (parser.equals("cos")) {
parser = "com.opensymphony.webwork.dispatcher.multipart.CosMultiPartRequest";
} else if (parser.equals("jakarta")) {
parser = "com.opensymphony.webwork.dispatcher.multipart.JakartaMultiPartRequest";
}
//step3.2)获取后通过反射实例化parser
try {
Class baseClazz = com.opensymphony.webwork.dispatcher.multipart.MultiPartRequest.class;
Class clazz = Class.forName(parser);
// make sure it extends MultiPartRequest
if (!baseClazz.isAssignableFrom(clazz)) {
addError("Class '" + parser + "' does not extend MultiPartRequest");
return;
}
// get the constructor
Constructor ctor = clazz.getDeclaredConstructor(new Class[]{
Class.forName("javax.servlet.http.HttpServletRequest"),
java.lang.String.class, int.class
});
// build the parameter list
Object[] parms = new Object[]{
request, saveDir, new Integer(maxSize)
};
// instantiate it
multi = (MultiPartRequest) ctor.newInstance(parms);
.................................................
}
//step4 进入JakartaMultiPartRequest的构造方法(我在webwork配置的parser是Jakarta所以进入了这个方法,如果你配置不同的parser回进入不同的parser
public JakartaMultiPartRequest(HttpServletRequest servletRequest, String saveDir, int maxSize)
throws IOException {
//设置保存参数
DiskFileUpload upload = new DiskFileUpload();
// we must store all uploads on disk because the ww multipart API is missing streaming
// capabilities
upload.setSizeThreshold(0);
upload.setSizeMax(maxSize);
if (saveDir != null) {
upload.setRepositoryPath(saveDir);
}
// Parse the request
try {
//此方法生成文件,将请求中的每个参数都生成一个临时文件比如upload_00000017.tmp, upload_00000018.tmp等,就算是form提交的参数也如此
List items = upload.parseRequest(servletRequest);
......................
}
执行完第四步,然后推出ServletDispatcher.wrapRequest,进入serviceAction方法,开始action及其拦截器的栈调用
在此过程中会删除非上传文件的临时文件,至于哪一步删除,我还没看出来,有时候很早有时候很晚,有时候甚至没有删除,我怀疑有个dameon在做这个事。
进入action和调用栈后,拦截器或action可通过如下代码访问上传的临时文件
MultiPartRequestWrapper wrapper = (MultiPartRequestWrapper) req;
File doc = wrapper.getFiles("doc")[0];
从上面的分析可以看出:
1)如果你使用webwork来上传文件(在进入action栈之前不修改源码或者做一些扩展、覆盖之类的动作),在进入action栈的时候文件已经上传,而且其文件名很难跟踪(upload_00000017.tmp,到底是00000017,0000018,或者0000022等等),毕竟有很多人上传文件,所以临时文件名很难确定,所以如果你想知道上传的进度很难。
2)利用webwork上传文件是两次拷贝过程,webwork首先从request的输入流中将文件流输出到一个临时文件,然后你再将此临时文件拷贝到你需要指定的路径。这是好是坏?