使用 jsoup 对 HTML 文档开展解析和操作
使用 jsoup 对 HTML 文档进行解析和操作http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index
使用 jsoup 对 HTML 文档进行解析和操作
http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index.html
?
使用 jsoup 对 HTML 文档进行解析和操作
接下来我们专门针对几种常见的应用场景举例说明 jsoup 是如何优雅的进行 HTML 文档处理的。
?
jsoup 使用一个 Whitelist 类用来对 HTML 文档进行过滤,该类提供几个常用方法:
表 1. 常用方法:
package koapp.web.inlet.test;import java.io.File;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import org.junit.After;import org.junit.Before;import org.junit.Test;/** * 测试 Jsoup 库操作HTML * * @author kenxu */public class JsoupTest {private Document doc;protected final Log logger = LogFactory.getLog(getClass());@Beforepublic void setUp() throws Exception {File input = new File("C:/kao/app/coreacl/readme.html");this.doc = Jsoup.parse(input,"UTF-8");}@Testpublic void testParse() throws Exception{logger.info(this.doc.title());Elements subtitle = this.doc.select("div.book div.titlepage h2.subtitle");for (Element ele : subtitle) { ele.addClass("jsoup-test");logger.info(ele.text());}logger.info(this.doc.html());}@Afterpublic void tearDown() throws Exception {this.doc = null;}}?感觉 好好啊 1 楼 vb2005xu 2011-11-22 http://www.ibm.com/developerworks/cn/java/j-cq01307/index.html 2 楼 vb2005xu 2011-11-23 http://www.ibm.com/developerworks/cn/web/wa-aj-flash/index.html 3 楼 vb2005xu 2011-11-23 http://open-open.com/open284035.htm
http://dev.baidu.com/wiki/connect/index.php?title=Open_API_2.0_%E6%96%87%E6%A1%A3
http://dev.baidu.com/wiki/connect/index.php?title=%E7%99%BE%E5%BA%A6OAuth2.0%E5%AE%98%E6%96%B9%E5%8F%82%E8%80%83%E6%96%87%E6%A1%A3
http://dev.baidu.com/wiki/connect/index.php?title=%E4%BD%BF%E7%94%A8%E5%BA%94%E7%94%A8%E5%85%AC%E9%92%A5%E3%80%81%E5%AF%86%E9%92%A5%E8%8E%B7%E5%8F%96Access_Token
http://dev.baidu.com/wiki/connect/index.php?title=%E4%BD%BF%E7%94%A8Authentication_Code%E8%8E%B7%E5%8F%96Access_Token 4 楼 vb2005xu 2011-11-25 http://www.ibm.com/developerworks/cn/java/j-lo-spring-utils1/index.html
http://www.ibm.com/developerworks/cn/java/j-lo-spring-utils2/