首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网络技术 > 网络基础 >

怎么做一个自动回帖机器人

2012-04-05 
如何做一个自动回帖机器人想研究一下网页自动获取和自动回复的技术,高手们给指点一下吧。需要了解那些知识,

如何做一个自动回帖机器人
想研究一下网页自动获取和自动回复的技术,

高手们给指点一下吧。

需要了解那些知识,或者给推荐点资料。

下面是个抓取的一个网站回帖时的流,整了半天还是不行,好像带文件上传的。



BatchFile code
POST /post.cgi?action=reply&fid=48&tid=1167162&arcs=1 HTTP/1.1Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/xaml+xml, application/vnd.ms-xpsdocument, application/x-ms-xbap, application/x-ms-application, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*Referer: http://bbs.shangdu.com/postedit.cgi?action=reply&fid=48&tid=1167162&pid=8740005&arcs=1Accept-Language: zh-cnContent-Type: multipart/form-data; boundary=---------------------------7d7251363d03daAccept-Encoding: gzip, deflateUser-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Mozilla/4.0(Compatible Mozilla/4.0(Compatible-EmbeddedWB 14.59 http://bsalsa.com/ EmbeddedWB- 14.59  from: http://bsalsa.com/ ; Mozilla/4.0(Compatible Mozilla/4.0EmbeddedWB- 14.59  from: http://bsalsa.com/ ; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30)Host: bbs.shangdu.comContent-Length: 893Connection: Keep-AliveCache-Control: no-cacheCookie: cookietime=86400; lastvisit=1194408380; _jsuser=%u62BD%u70DF%u4E0D%u70B9%u706B; _usrinfo_update=1193283794; _ccnuid=510790; _ccnuser=%B3%E9%D1%CC%B2%BB%B5%E3%BB%F0%40bbs.shangdu.com; _ccnpw=9e8cb11a69d81d8bac3cbc4b65e5b223; _ccnkey=60%7C200%7C1666%7C%C7%E0%CD%AD%B3%A4%C0%CF%7C510790%7C2%7C1%7C0%7C0%7C1%7C5242880%7C%C9%CF%BA%A3%CA%D0%D3%D0%CF%DF%CD%A8%7C3c14bcd8addba049fcba112883be7668-----------------------------7d7251363d03daContent-Disposition: form-data; name="subject"-----------------------------7d7251363d03daContent-Disposition: form-data; name="font"宋体-----------------------------7d7251363d03daContent-Disposition: form-data; name="size"3-----------------------------7d7251363d03daContent-Disposition: form-data; name="color"White-----------------------------7d7251363d03daContent-Disposition: form-data; name="message"饿了-----------------------------7d7251363d03daContent-Disposition: form-data; name="attach"; filename=""Content-Type: application/octet-stream-----------------------------7d7251363d03daContent-Disposition: form-data; name="pid"8740005-----------------------------7d7251363d03daContent-Disposition: form-data; name="dosubmit"提交文章-----------------------------7d7251363d03da--


[解决办法]
完全不懂
[解决办法]
不懂
[解决办法]
呵呵。不懂
[解决办法]
和谐接分 ~~
[解决办法]
是HTML语言吧
[解决办法]
能伪造Referer和Cookie,并会使用xmlhttp抓取数据,基本上就ok了。
[解决办法]
从我所掌握的知识来看,我想若要作一个发贴/回帖机器人,需要具备以下一些技术和知识背景:
1. 了解和熟悉HTML/XML等与网页相关的标记语言规范,以便你能从网页源代码看懂各个标签的含义和网页的结构等;
2. 你需要熟悉HTTP甚至HTTPS等互联网应用协议,只有了解了HTTP协议你才能知道你在通过浏览器访问一个网页时背后都发生了什么事情,比如HTTP请求信息包含哪些域、HTTP响应信息包含哪些信息等等;当然,有一些开源的软件包已经把HTTP协议的很多处理都给实现了,比如CURL。
3. 你可能还需要了解一下AJAX等近几年比较流行的技术,了解背后的原理和机制。
4. 掌握一两门编程语言,比如C++等较底层的编程语言,或者像PERL/PHP这样的脚本编程语言。
5. 在具备上述这些知识之后,我想,若要做一个针对某个特定论坛的发贴/回帖机器人(注意是“特定”,不是做通用的发贴机器人,后者几乎难以实现),基本的思路是:通过人工分析,定位到发贴或回贴的URL请求(一般是POST请求),看看这个请求需要哪些数据域,然后自己构造这样的POST请求;有些论坛在发送POST请求或GET请求时需要传递Cookie和Referer信息,因此在发送POST请求时可能还需要你进行相应的伪造;
但是说起来容易,还是需要考虑很多细节问题,比如大多数论坛需要先登陆才能让你发贴或回帖,因此需要先通过HTTP协议完成登陆的过程,之后才能自动发贴或回贴。


就说这些吧,只有你自己亲自去实践,才能遇到更多的需要解决的问题。

热点排行