用jsoup去获取网页的所有链接问题。
代码如下:
import java.io.File;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
import org.jsoup.Connection.*;
public class Teste{
public static void main(String[] args){
try {
Document doc = Jsoup
.connect("http://news.sina.com.cn/")
.userAgent(
"Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)")
.timeout(5000)
.get();
String tile=doc.title();
String text = doc.body().text();
Elements hrefs = doc.select("a[href]");
System.out.println(hrefs);
} catch (IOException e) {
e.printStackTrace();
}
}
}
通过语句 Elements hrefs = doc.select("a[href]"); 可以获取所有链接,但当我怎么做可以一条一条的取出子链接(因为我需要再对每个子链接在进行测试)
[解决办法]
你要写个迭代函数