施用 dom4j 解析 XML

2012-09-04

使用 dom4j 解析 XML?dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说，这个框架已经远远的超过

使用 dom4j 解析 XML

?dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说，这个框架已经远远的超过了W3C DOM、JDOM了。而且，dom4j支持XPath。

? ?dom4j的API里面包含一个解析XML文档的工具，我们使用这个解析器创建一个示例XML文档，清单1.catalog.xml。然后使用同一个解析器修改catalog.xml，清单2是修改生的XML文档，catalog-modified.xml。?

清单1.示例XML文档（catalog.xml）

清单2.修改后的XML文档（catalog-modified.xml）
一：创建catalog.xml
// 1：使用 SAXReader 解析 XML 文档 catalog.xml：SAXReader saxReader = new SAXReader();Document documentOld = saxReader.read(new File("e:/catalog.xml"));// 2：使用XPath表达式从article元素中获得level节点列表，如果level属性值是“Intermediate”则改为“Introductory”。List list = documentOld.selectNodes("//article/@level");Iterator iter = list.iterator();while (iter.hasNext()) {  Attribute attribute = (Attribute) iter.next();  if (attribute.getValue().equals("Intermediate"))    attribute.setValue("Introductory");}// 3：修改title/* * 1：遍历所有article元素 2：遍历article元素下的title元素 3：比较修改 */list = document.selectNodes("//article");iter = list.iterator();while (iter.hasNext()) {  Element element = (Element) iter.next();  Iterator iterator = element.elementIterator("title");  while (iterator.hasNext()) {    Element titleElement1 = (Element) iterator.next();    if (titleElement1.getText()        .equals("Java configuration with XML Schema"))      titleElement1.setText("Create flexible and extensible XML schema");  }}?
以过多次修改，得到catalog-modified.xml的Document对象，再写入文件！
?
从上面的例子，我们可以看出，dom4j里最常用的几个地方是：
?
1：枚举（Iterator）
// 枚举所有子节点
for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
? ?Element element = (Element) i.next();
? ?// do something
}
// 枚举名称为foo的节点
for ( Iterator i = root.elementIterator("foo"); i.hasNext();) {
? ?Element foo = (Element) i.next();
? ?// do something
}
// 枚举属性
for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
? ?Attribute attribute = (Attribute) i.next();
? ?// do something
}
?
2：递归
public void treeWalk(Element element) {
? ? for (int i = 0, size = element.nodeCount(); i < size; i++) {
? ? ? ?Node node = element.node(i);
? ? ? ?if (node instanceof Element) {
? ? ? ? ? ?treeWalk((Element) node);
? ? ? ?} else {
? ? ? ? ? ?// do something....
? ? ? ?}
? ? }
}
?
3：得到想要的节点的对象，对XPath的良好支持
public void bar(Document document) {
List list = document.selectNodes("//foo/bar");
Node node = document.selectSingleNode("//foo/bar/author");
String name = node.valueOf("@name");
}
例如，如果你想查找XHTML 文档中所有的超链接，下面的代码可以实现：
public void findLinks(Document document) throws
DocumentException {
List list = document.selectNodes( //a/@href );
for (Iterator iter = list.iterator(); iter.hasNext(); ) {
Attribute attribute = (Attribute) iter.next();
String url = attribute.getValue();
}
}
?
4：XML----String转换
// XML 转字符串
Document document = ...;
String text = document.asXML();
// 字符串转XML
String text = "<person><name>James</name></person>";
Document document = DocumentHelper.parseText(text);
?
?
下面的例子,是一个运用递归,复制文件的例子:
?
Dom4jDemo2 dom4jDemo = new Dom4jDemo2();
// ------------源---------------
SAXReader saxReader = new SAXReader();
Document docSource = saxReader.read(new File("e:\\jcmReponse.xml"));
Element rootSource = docSource.getRootElement();
?
// ------------目标-------------
Document docTarget = DocumentHelper.createDocument();
Element rootTarget = docTarget.addElement(rootSource.getNamespacePrefix() ? +":"+rootSource.getName());
?
dom4jDemo.treeWalk(iteratorSource,return1);
dom4jDemo.writeNewXml(docTarget, "e:\\b.xml");
?
// 写入
public void writeNewXml(Document doc, String fileName) {
try {
? ? OutputFormat format = OutputFormat.createPrettyPrint();
? ? XMLWriter writer = new XMLWriter(new FileWriter(fileName), format);
? ? writer.write(doc);
? ? writer.close();
} catch (IOException e) {
? ? e.printStackTrace();
? }
}
?
// 递归
private void treeWalk(Element element, Element targetE) {
? ? for (int i = 0, size = element.nodeCount(); i < size; i++) {
? ? ? ?Node node = element.node(i);
? ? ? ?Element eTemp = null;
? ? ? ?if (node instanceof Element) { ? ? ? ? ??
?
? ? ? ? ? ?String nameSpacePrefix = ((Element) node).getNamespacePrefix();
? ? ? ? ? ?if(nameSpacePrefix == null || "".equals(nameSpacePrefix))
? ? ? ? ? ? ? eTemp = targetE.addElement(node.getName());
? ? ? ? ? ?else
? ? ? ? ? ? ? eTemp = targetE.addElement(nameSpacePrefix + ":"+ node.getName());
?
? ? ? ? ? ?eTemp.setText(node.getText());
?
? ? ? ? ? ?for (Iterator ite = ((Element) node).attributeIterator(); ite.hasNext();) {
? ? ? ? ? ? ? Attribute atr = (Attribute) ite.next();
? ? ? ? ? ? ? eTemp.addAttribute(atr.getNamespacePrefix() + ":"
? ? ? ? ? ? ? ? ? ? ?+ atr.getName(), atr.getValue());
? ? ? ? ? ?}
? ? ? ? ? ?treeWalk((Element) node, eTemp);
? ? ? ?}
? ? }
} ?

热点排行

XML SOAP

施用 dom4j 解析 XML