首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > VB >

【问】怎么解析一段网页源码?(比如取出所有超链接)

2012-02-10 
【问】如何解析一段网页源码?(比如取出所有超链接)现有一段源码(在字符串变量中),请问如何自动解析,取出所有

【问】如何解析一段网页源码?(比如取出所有超链接)
现有一段源码(在字符串变量中),
请问如何自动解析,取出所有超链接?
比如:

For   Each   V   In   Document.Links
...
Next

(注:该段代码中有N多的脚本代码,其中也有如:Document.Write   " <A   Href=ABC   。。。
之类的代码,这并不是我想要的,我只要实际显示的HTML文件中的超链接)


[解决办法]
document.getElementsByTagName( "body ")(0).getElementsByTagName( "a ")


[解决办法]
调试放到 watch 里面看看结果。
[解决办法]
自己提取出 <a herf> </a> 之间的字符就是URL了
[解决办法]
我做过这个,QQ252593739
[解决办法]
用inet取的话,先用正则串去掉script

大概是 " <script(.*)> (.*) <\/script> "这么个串去了script

然后用a的串取出url

热点排行