首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > CSS >

使用 jsoup 对 HTML 文档开展解析和操作

2013-09-09 
使用 jsoup 对 HTML 文档进行解析和操作http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index

使用 jsoup 对 HTML 文档进行解析和操作

http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index.html

?

使用 jsoup 对 HTML 文档进行解析和操作

接下来我们专门针对几种常见的应用场景举例说明 jsoup 是如何优雅的进行 HTML 文档处理的。

?

jsoup 使用一个 Whitelist 类用来对 HTML 文档进行过滤,该类提供几个常用方法:


表 1. 常用方法:

package koapp.web.inlet.test;import java.io.File;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import org.junit.After;import org.junit.Before;import org.junit.Test;/** * 测试 Jsoup 库操作HTML * * @author kenxu */public class JsoupTest {private Document doc;protected final Log logger = LogFactory.getLog(getClass());@Beforepublic void setUp() throws Exception {File input = new File("C:/kao/app/coreacl/readme.html");this.doc = Jsoup.parse(input,"UTF-8");}@Testpublic void testParse() throws Exception{logger.info(this.doc.title());Elements subtitle = this.doc.select("div.book div.titlepage h2.subtitle");for (Element ele : subtitle) { ele.addClass("jsoup-test");logger.info(ele.text());}logger.info(this.doc.html());}@Afterpublic void tearDown() throws Exception {this.doc = null;}}?感觉 好好啊 1 楼 vb2005xu 2011-11-22   http://www.ibm.com/developerworks/cn/java/j-cq01307/index.html 2 楼 vb2005xu 2011-11-23   http://www.ibm.com/developerworks/cn/web/wa-aj-flash/index.html 3 楼 vb2005xu 2011-11-23   http://open-open.com/open284035.htm
http://dev.baidu.com/wiki/connect/index.php?title=Open_API_2.0_%E6%96%87%E6%A1%A3
http://dev.baidu.com/wiki/connect/index.php?title=%E7%99%BE%E5%BA%A6OAuth2.0%E5%AE%98%E6%96%B9%E5%8F%82%E8%80%83%E6%96%87%E6%A1%A3
http://dev.baidu.com/wiki/connect/index.php?title=%E4%BD%BF%E7%94%A8%E5%BA%94%E7%94%A8%E5%85%AC%E9%92%A5%E3%80%81%E5%AF%86%E9%92%A5%E8%8E%B7%E5%8F%96Access_Token

http://dev.baidu.com/wiki/connect/index.php?title=%E4%BD%BF%E7%94%A8Authentication_Code%E8%8E%B7%E5%8F%96Access_Token 4 楼 vb2005xu 2011-11-25   http://www.ibm.com/developerworks/cn/java/j-lo-spring-utils1/index.html

http://www.ibm.com/developerworks/cn/java/j-lo-spring-utils2/

热点排行