首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网络技术 > 网络基础 >

初步了解爬虫 很多有关问题请问

2012-03-09 
初步了解爬虫 很多问题请教我用java socket 做了一个http的程序 下载一个网页的内容 可是提示说浏览器不支

初步了解爬虫 很多问题请教
我用java socket 做了一个http的程序 下载一个网页的内容 可是提示说浏览器不支持 js 是不是那里要设置下

假如有的网页里面很多js 并且引用的是外部的文件的js后缀的文件 那么得到的信息不充分 怎么办

还有有的页面有ajax 页面的内容 依赖于js的函数 变化 怎么处理列

做搜索的话应该学点什么列 谢谢大家

[解决办法]
估计是你默认用了浏览器的配置,在IE里改成支持js
[解决办法]
lz怎么在说胡话?
用java socket做的HTTP客户程序不可能判断JS!
你的客户程序一定是调用了IE的组件。


爬虫只需要通过HTTP协议通信提取数据,
然后分析HTML标签,取得主要数据,
在把数据保存到数据库中的。

热点排行