请教一下nutch 身份验证的问题
我看网上http://wiki.apache.org/nutch/HttpAuthenticationSchemes 这篇文章说的是身份验证的
但是看不太懂,哪位前辈能给小弟讲讲?
比如
<credentials username="susam" password="masus">
<authscope host="example" port="8080" realm="blogs"/>
<authscope host="example" port="8080" realm="wiki"/>
</credentials>
<credentials username="admin" password="nimda">
<default/>
</credentials>
里的<authscope host="example" port="8080" realm="blogs"/>这句话中host、realm两个属性干嘛用的就不太明白
希望高人能指点下,谢谢!
还有一个问题就是,这块的应用,是用来爬取需要登录才能进行爬取的网页的吧?
[解决办法]
顶----------顶--------------