XULRunner with Java: JavaXPCOM Tutorial 四

2012-11-22

XULRunner with Java: JavaXPCOM Tutorial 47. 用JavaXPCOM来自动浏览网页?? 在这一节里我们将解决一些自

XULRunner with Java: JavaXPCOM Tutorial 4

7. 用JavaXPCOM来自动浏览网页
?? 在这一节里我们将解决一些自动浏览网页中的一些问题，尝试把一下通用的任务抽象成人类可读的方法，因此你可以轻易的阅读

代码并知道它的功能。我们将构建一个Web Browser来加载网页，点击按钮或者超链接，使用XPath来抽取一下有用的信息。在每一个

小节里面，我们都将在我们的浏览器里增加新的功能，因此在最后，我们将有一个Web Browser，它能够实现网页的自动
浏览。

7.1 使用我们的浏览器来加载网页
??? 在例子 SimpleBrowser里，我们使用方法 public boolean setUrl(String url) 来让浏览器加载一个url。这个方法的问题是它

可以让浏览器开始加载一个页面，但是不会等待浏览器加载页面完成。我们写了一个方法叫做go来实现这个功能，因此后面我们将使

用这种方法来安全的加载一个页面，阻塞住执行流程直到页面加载成功或者超时。
??? 注：实现的方法是在setUrl的时候定义一个CountDownLatch，然后监听browser.addProgressListener，等页面完成后把这个

CountDownLatch countDown一下。调用setUrl后使用CountDownLatch的await方法等待加载完成或者超时。注意调用setUrl时要启动

一个SWT线程??? ???
?????????????? display.syncExec(new Runnable() {
??? ??? ??? public void run() {
??? ??? ??? ??? browser.setUrl(url);
??? ??? ??? }
??? ??? });
??? 另外，我们可能还想获得加载后的页面内容，所有译者增加了一个变量content。增加的代码如下
??? ??? ??? ??? browser.addProgressListener(new ProgressListener() {
??? ??? ??? ??? ??? public void changed(ProgressEvent event) {
??? ??? ??? ??? ??? }

??? ??? ??? ??? ??? public void completed(ProgressEvent event) {
??? ??? ??? ??? ??? ??? // When a page is loaded, decrement the latch,
??? ??? ??? ??? ??? ??? // which count will be 0 after this call.
??? ??? ??? ??? ??? ??? latch.countDown();
??? ??? ??? ??? ??? ??? content=browser.getText();// added by LiLi
??? ??? ??? ??? ??? }
??? ??? ??? ??? });

7.2 解析XPath来获得W3C Node
??? 一旦我们能够在浏览器里加载一个HTML页面，我们可能想访问DOM节点来抽取信息。前面我们花了一节来吧Mozilla Node转换成

W3C node。现在我们使用那个方法来用标准的方法操作W3C Node。我们实现了一些方法来创建XPath Evaluator和XPath resolver来

抽取节点。当Xpath evaluator返回一个结果，我们把每个返回的DOM node转换成响应的W3C DOM element，使用的方法是 static

Node getNodeInstance( nsIDOMNode node ) 。因此，使用我们的browser可以直接调用下面的方法：

热点排行

Web前端

XULRunner with Java: JavaXPCOM Tutorial 四