一段perl代码,包含网页抓取与字符串编码
use LWP::Simple;
use utf8;
use Encode;
open F,'>d:/bc.html';
?
$content = get("http://www.163.com");
#Encode::_utf8_on($content);
$content=encode('gb2312',$content);
die "Couldn't get it!" unless defined $content;
print F $content;
#print 'complete';
close F;
?
?
以上代码去网页下载网页文件,然后写入文件中,
抓取网页使用了LWP::Simple
字符串编码使用了Encode模块的encode方法,若不进行转码则会乱码