一个php采集类,含下载远程图片并替换原文
今天没事完善了一个php采集类,这给大家分享下。
本实例,可以,自动下载远程图片,并替换文章中的图片地址。。。
实例下载地址 http://download.csdn.net/detail/open520yin/4899183
实例:
<?phpheader("Content-Type: Text/Html"); $url = "http://sh.sina.com.cn/travel/message/2012-12-16/191225659_5.html"; include("Snoopy.class.php"); $snoopy = new Snoopy; $snoopy->fetch($url); //获取所有内容 $html = $snoopy->results; //显示结果 $title = $snoopy->getTitle();//获取标题 $text = $snoopy->getCent('<div class=\"(.*)\" id=\"artibody\">','<p class=\"page\">');//获取主体//替换规则$arr = array(0=>'<span id=\"_function_code_page\">(.*?)</span>',1=>'<a href=\"(.*)html#page_pic\">',2=>'</a>',3=>'<div class=\"article-video artice-pic\" vid=\"\"></div>',4=>'</div>',5=>'<a name=\"page_pic\">',6=>'<!--(.*)-->',7=>'<span class=\"img_descr\">(.*?)</span>',); $text = $snoopy->replace($text,$arr);//过滤echo $snoopy->saveImg($text); //下载远程图片,并替换文章图片地址?>