提取带框架的网页源代码
输入地址 http://www.0797123.com/index.asp
看到的是下图,未登陆的页面
使用用户名和密码登陆后看到下图
问题: 想用vb做程序,下载此网页,提取信息编号、信息内容和发布时间.
用普通的方法保存源代码(见下面的方法一、二),得到的都不是图2表中的数据,还有别的方法吗?
方法一:WebBrowser1.Document.body.innerHTML
方法二:WebBrowser1.Document.All(0).outerHTML
目前用vb做程序,用WebBrowser控件已经实现自动登陆到图2的状态,因该网页有框架,如何保存该网页为源代码?
只要能保存网页源代码,那提取信息编号、信息内容等信息不成问题. 不一定非得用WebBrowser,用别的方法能解决也行。
平日都是替别人解决问题,今剑也有问题,
望大家都来帮忙,提供思路或代码,剑将感激之至......
我的邮箱:lpfdxx@qq.com
如有意,请和我联系,可以提供测试用户名和密码,如果谁能解决我的问题,我还可以付一定报酬(人民币,邮件中可商量).
拒绝灌水!
[解决办法]
换个控件。
[解决办法]
How much money?
[解决办法]
帮顶.....
[解决办法]
这个需要了解dthml,可以通过frames访问
http://blog.csdn.net/sysdzw/archive/2009/08/19/4463844.aspx
[解决办法]
哈哈,经过阿泰的指点已经顺利解决了,谢谢阿泰,
同时也谢谢sysdzw,下面这个帖子变成了散分帖,心里真是痛快.......
因是技术帖,请大家来接分时,顺便谈一下下载源代码的效率问题,用inet、webbrowser或是别的方式
[解决办法]
用 XMLHTTP 下源码很快,代码也简单的多。
Set X = CreateObject("Microsoft.XMLHTTP")
URL = "http://xxx.xxx.xxx"
X.Open "GET", URL, False
X.send
Dim b() As Byte
b = X.responseBody
取到二进制数组,然后随便你蹂躏了 ,可以创建多个XMLHTTP 对象,分别对不同页面同时下载,
(居然是多线程,这么简单就实现了,但不是VB的,是XMLHTTP 的多线程,就像同时打开多个浏览器窗口一样)
附:
自编的网页分析小工具,简单实用
http://club.excelhome.net/viewthread.php?tid=377077&?fromuid=26992
[解决办法]
这么快就结贴了,还想要个测试帐号试试来。
一般要截取字串的我用inet,比如天气预报等。
其它的需要生成页面的用webbrowser,不过inet处理字串会有个编码造成乱码的问题。
[解决办法]
我是来接分的。
[解决办法]