首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > CSS >

HtmlUnit抓取js点染页面

2013-10-31 
HtmlUnit抓取js渲染页面public static void getAjaxPage() throws Exception{WebClient webClient new W

HtmlUnit抓取js渲染页面
public static void getAjaxPage() throws Exception{WebClient webClient = new WebClient();webClient.setJavaScriptEnabled(true);webClient.setCssEnabled(false);webClient.setAjaxController(new NicelyResynchronizingAjaxController());webClient.setTimeout(Integer.MAX_VALUE);webClient.setThrowExceptionOnScriptError(false);HtmlPage rootPage = webClient.getPage("http://tt.mop.com/read_14304066_1_0.html");System.out.println(rootPage.asXml());}

maven依赖:

<dependency><groupId>net.sourceforge.htmlunit</groupId><artifactId>htmlunit-core-js</artifactId><version>2.9</version><scope>compile</scope></dependency><dependency><groupId>net.sourceforge.htmlunit</groupId><artifactId>htmlunit</artifactId><version>2.9</version><scope>compile</scope></dependency>

说明:?

Nutch插件:nutch-htmlunit用于替换Nutch自身的Http Fetch组件

?

热点排行