来者有分,关于http数据采集的问题。
大家好,我有个关于http数据采集的问题。
如果我想读懂下面内容的含义,该看那些书或者网站,完全从一个会些C#,asp但是对于http协议一无所知的人来说。
内容:
----------------------------------------------
POST /securities/index.action HTTP/1.1
Accept: application/x-shockwave-flash, image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
Referer: http://data.cnstock.com/securities/index.action
Accept-Language: zh-cn
Content-Type: application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; InfoPath.1; .NET CLR 1.1.4322)
Host: data.cnstock.com
Content-Length: 43
Connection: Keep-Alive
Cache-Control: no-cache
Cookie: JSESSIONID=3366DA367F909E6A72866CD53AD6890A; chwlaz=1178707944701; chweblog_dir=1178707944717; chweblog_auto=1178707944732; chwlazq=1; http://data.cnstock.com/securities/basicFinance.action#positionchweblog_auto=1%20tmpDatachweblog_dir=1chweblog_auto=1; tmpDatachweblog_dir=1; http://data.cnstock.com/securities/index.actionchweblog_auto=1; http://data.cnstock.com/securities/cashFlow.action#positionchweblog_auto=1%20JSESSIONID=188C0537CF286A3A06838A7883CC8415chweblog_auto=1
exgId=600003&type=stock&Submit=%B2%E9%D1%AF
HTTP/1.1 200 OK
Content-Type: text/html;charset=GBK
Content-Language: zh-CN
Transfer-Encoding: chunked
Date: Wed, 09 May 2007 10:52:22 GMT
Server: Apache-Coyote/1.1
GET /styles/cnstock.css HTTP/1.1
Accept: */*
Referer: http://data.cnstock.com/securities/index.action
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
If-Modified-Since: Fri, 26 Jan 2007 08:21:59 GMT
If-None-Match: W/ "2923-1169799719015 "
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; InfoPath.1; .NET CLR 1.1.4322)
Host: data.cnstock.com
Connection: Keep-Alive
Cookie: JSESSIONID=3366DA367F909E6A72866CD53AD6890A; chwlaz=1178707944701; chweblog_dir=1178707944717; chweblog_auto=1178707944732; chwlazq=1; http://data.cnstock.com/securities/basicFinance.action#positionchweblog_auto=1%20tmpDatachweblog_dir=1chweblog_auto=1; tmpDatachweblog_dir=1; http://data.cnstock.com/securities/index.actionchweblog_auto=1; http://data.cnstock.com/securities/cashFlow.action#positionchweblog_auto=1%20JSESSIONID=188C0537CF286A3A06838A7883CC8415chweblog_auto=1
GET /scripts/public.js HTTP/1.1
Accept: */*
Referer: http://data.cnstock.com/securities/index.action
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
If-Modified-Since: Tue, 19 Dec 2006 11:41:06 GMT
If-None-Match: W/ "1586-1166528466000 "
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; InfoPath.1; .NET CLR 1.1.4322)
Host: data.cnstock.com
Connection: Keep-Alive
Cookie: JSESSIONID=3366DA367F909E6A72866CD53AD6890A; chwlaz=1178707944701; chweblog_dir=1178707944717; chweblog_auto=1178707944732; chwlazq=1; http://data.cnstock.com/securities/basicFinance.action#positionchweblog_auto=1%20tmpDatachweblog_dir=1chweblog_auto=1; tmpDatachweblog_dir=1; http://data.cnstock.com/securities/index.actionchweblog_auto=1; http://data.cnstock.com/securities/cashFlow.action#positionchweblog_auto=1%20JSESSIONID=188C0537CF286A3A06838A7883CC8415chweblog_auto=1
----------------------------------------------
这是在访问一个网站的时候从http返回的值中借取的一部分。
我个人的理解是,这些东西是记录了http运行的时候得一些状态。
我想用3个月左右的时间来学习这方面的内容,所以希望大家按照这个时间范围帮忙推荐写入门的书或资料。
[解决办法]
网络技术方面的吧 例如讲html语言的
[解决办法]
可以看一些web服务器配置方面的书,都会有些介绍
[解决办法]
rfc2616文档
大致了解就行,花不了多长时间的
[解决办法]
建议你看看HTTP协议方面的,对你理解提交请求给服务器和服务器返回响映有帮助.
[解决办法]
一些是服务器返回给客户端的基本信息,
一些是客户端保留在服务器端的信息。
那些信息的作用正如它们的名字。
[解决办法]
POST /securities/index.action HTTP/1.1
GET /scripts/public.js HTTP/1.1
这样的是表示HTTP请求方式(POST|GET),请求的资源以及所使用的HTTP协议版本。
其他内容,运行这个asp,然后就理解了
<%
dim obj,str
set obj=Request.ServerVariables
str= " "
for each item in obj
str=str& " <b> "&item& " </b> : "&obj(item)& " <br> "
next
response.write str
%>
[解决办法]
帮顶
[解决办法]
不懂,学习,帮顶,蹭点分。
[解决办法]
不懂,学习,帮顶,蹭点分。
[解决办法]
楼上的不要学我!
数据采集很难的!
[解决办法]
把 文件上传POST数据包分析透,就差不多了.
再就是一些头的含义.大致掌握一下.
知道 如何设置COOKIE
如何设置代理.
如何设置 HTTP身份认证.
基本上就差不多了.