【问】如何解析一段网页源码?(比如取出所有超链接)
现有一段源码(在字符串变量中),
请问如何自动解析,取出所有超链接?
比如:
For Each V In Document.Links
...
Next
(注:该段代码中有N多的脚本代码,其中也有如:Document.Write " <A Href=ABC 。。。
之类的代码,这并不是我想要的,我只要实际显示的HTML文件中的超链接)
[解决办法]
document.getElementsByTagName( "body ")(0).getElementsByTagName( "a ")
[解决办法]
调试放到 watch 里面看看结果。
[解决办法]
自己提取出 <a herf> </a> 之间的字符就是URL了
[解决办法]
我做过这个,QQ252593739
[解决办法]
用inet取的话,先用正则串去掉script
大概是 " <script(.*)> (.*) <\/script> "这么个串去了script
然后用a的串取出url