首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > XML SOAP >

应用Digester解析XML文档示例

2012-10-07 
使用Digester解析XML文档示例概述  解析XML文档方面有不少的方法,也有不少的工具包可用,这里介绍的是来自A

使用Digester解析XML文档示例

概述

  解析XML文档方面有不少的方法,也有不少的工具包可用,这里介绍的是来自Apache Jakarta的Digester,使用其解析XML文件非常方便而不需要过多的关心底层的具体解析过程。

  Digester最早出现在Struts中,后来随着Struts的发展以及其的公用性而被提到commens中独自立项,其底层实现的是SAX解析。当前版本为:1.5

正文

  1. 安装与配置

  使用Digester需要如下几个软件包:

  Digester ,BeanUtils, Collections, Commens-Logging,还有一个遵循SAX(Simple API for XML)2.0或JAXP(Java API for XML Parsing) 1.1规范的XML解析器,如Xerces。相关下载地址见附录。如果需要使用log4j做为日志输出,则亦请下载之。

  将下载来的zip包解压,并将其中的jar文件拷贝到你的工程文件的lib目录中,并在工程classpath中包含上述jar文件的路径。

  在您工程的类目录(如classes)新建一commons-logging.properties文件,内容为:

org.apache.commons.logging.Log=org.apache.commons.logging.impl.Log4Jlogger

  这表明系统将使用log4j做为日志输出,再建一log4j.proerties文件,内容请参看log4j文档或其他参考资料。

Digester据说最早是为解析struts的配置文件开发的,后来慢慢的就发展成一个轻量,快速,单向(只能从xml到java对象)的一个绑定框架,在运行时实现绑定,无需定义xml文件的DTD或Schema,简单快速。
一、使用Digester的步骤
1.?创建一个Digester的实例。完成parse后,实例可以被安全的重用,但实例不是线程安全的。
2.?设置配置属性
3.?加入处理规则
4.?调用digester.parse()方法。
二、从一个例子说起
先看一个Digester文档上的简单例子
?对象树
package?mypackage;
public?class?Foo?...{
??public?void?addBar(Bar?bar);
?public?Bar?findBar(int?id);
?public?Iterator?getBars();
?public?String?getName();
?public?void?setName(String?name);
?}
?package?mypackage;
?? public?class?Bar?...{

???public?int?getId();
???public?void?setId(int?id);
???public?String?getTitle();
???public?void?setTitle(String?title);
?}

XML文档片段
<foo?name="The?Parent">
???<bar?id="123"?title="The?First?Child"/>
????<bar?id="456"?title="The?Second?Child"/>
??</foo>

解析代码
?Digester?digester?=?new?Digester();
??digester.setValidating(false);
??digester.addObjectCreate("foo",?"mypackage.Foo");
??digester.addSetProperties("foo");
??digester.addObjectCreate("foo/bar",?"mypackage.Bar");

?digester.addSetProperties("foo/bar");
??digester.addSetNext("foo/bar",?"addBar",?"mypackage.Bar");
??Foo?foo?=?(Foo)?digester.parse();
????从例子可以看到Digester的执行步骤是扫描xml文档,匹配特定的xml节点,在每一个节点按照预定的处理规则操纵对象,包括创建对象,设置对象属性,建立对象树等。

三、节点匹配规则

<a>?????????--?Matches?pattern?"a"
????<b>???????--?Matches?pattern?"a/b"
??????<c/>????--?Matches?pattern?"a/b/c"
??????<c/>????--?Matches?pattern?"a/b/c"
????</b>
????<b>???????--?Matches?pattern?"a/b"
??????<c/>????--?Matches?pattern?"a/b/c"
??????<c/>????--?Matches?pattern?"a/b/c"
??????<c/>????--?Matches?pattern?"a/b/c"
????</b>
?</a>


????可以看到匹配规则非常简单,此外,匹配还支持通配符,像*/a就匹配任意层次内的<a>。
?
????一个特定的XML元素可以被匹配多次,所对应的处理规则执行的顺序如下:如果是begin和body方法,按照规则被加入到Digester的顺序执行,如果是end方法,则相反(参见后面处理规则)。
?
????对于通配符匹配,当一个确定的匹配发生时(如果多个通配符匹配发生,最长的一个被认为是一个确定的匹配),通配符匹配将被忽略。这个意思就是说,当规则A被加入到*/a时,意思是这个规则匹配任意一个<a>元素,但是如果规则C被加入到x/a,则A对于<x><a>的匹配会被或略。假设规则A和B匹配*/a,如果想给x/a加入规则C,则需要给x/a重复加入规则A和规则B,就像下面这样:

Rule?ruleA?=?new?ObjectCreateRule();
??Rule?ruleB?=?new?SetNextRule();
??Rule?ruleC?=?new?SetPropertiesRule();
??digester.addRule("*/a",?ruleA);
??digester.addRule("*/a",?ruleB);

digester.addRule("x/a",?ruleA);
??digester.addRule("x/a",?ruleB);
??digester.addRule("x/a",?ruleC);


?
四、处理规则
????处理规则的目的就是定义当匹配发生时做什么事情。每一个处理规则都是org.apache.commons.digester.Rule接口的实现类。当匹配发生时Rule接口的回调方法被调用,执行相应的操作。

Rule接口的方法:
begin???????当进入匹配元素时调用
body????????当进入匹配元素的内容时调用
end?????????当离开匹配元素时调用
finish??????当paser结束时调用
?
常见的内置处理规则
ObjectCreateRule:进入匹配元素时调用,创建一个特定的java对象。

SetPropertiesRule:进入匹配元素时调用,利用Java的反射API设置栈顶对象的属性,要求Java对象的属性名匹配XML元素的属性名。

SetNextRule:离开匹配元素时调用,digester分析下一个栈顶对象,调用该对象的指定属性的setter方法,将当前栈顶对象作为参数传入到该方法,同时弹出当前栈顶对象。
?
SetTopRule:和SetNextRule含义相同,分析栈顶对象,调用该对象指定属性的setter方法,将下一个栈顶对象作为参数传给该方法(典型会被调用的方法是setParent)。?

CallMethodRule:调用栈顶对象指定的方法。设置这个规则需要指出调用的方法名,参数个数,参数Java类型(可选),参数值一般是匹配元素的body?content,用CallParamRule指定。

CallParamRule?:标识CallMethodRule中的方法参数。参数值可能是匹配元素的某个属性,或匹配元素的body?content。

Digester的处理过程
????Digester使用堆栈来存储对象,当ObjectCreateRule被执行时,将对象压入栈,像SetPropertiesRule,SetTopRule,CallMethodRule等规则都是对栈顶对象的操作。当SetNextRule被执行时,弹出栈顶对象,下一个栈顶对象成为栈顶对象,最后返回对象树的根节点。

<!--EndFragment-->

热点排行