首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > PHP >

简单php采集网页部分文字有关问题,求指点,谢谢

2013-06-19 
简单php采集网页部分文字问题,求指点,多谢本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑目标采集页面如

简单php采集网页部分文字问题,求指点,多谢
本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑 目标采集页面如下代码(示例页面,数据可能变化,但格式不会变化)
要求得到table中主要的4项数据:序 号、违法时间、违法地点、违法行为(即93行~130行之间的)
希望能给出详细一点的php代码。


<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<base href="http://218.25.58.44:80/" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>交警查询</title>
<link href="style/style.css" rel="stylesheet" type="text/css" />
<style>
.center_td {
text-align:center;
}
</style>
</head>

<body>
<div class="top">
<div class="menu"><ul><li><a href="#">网站首页</a></li><li> 沈阳交警</li><li> 交通新闻 </li><li> 视频播放 </li><li> 为您服务 </li><li> 在线办公 </li><li> 信息查询 </li><li> 征求意见 </li><li> 联系我们</ul>
</div>
<div class="txt"><!-- 沈阳小雨转小到中雨21~14   今天是:2010年5月28日    -->返回首页 / 设为首页 / 添加搜藏</div>
</div>
<div class="main">
<table width="100%" border="0" cellspacing="0" cellpadding="0">
  <tr>
    <td valign="top" class="lmenu" >
    <div class="l1">
    <h1><a href="#"><img src="images/cxx_04.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    <li>模拟考场</li>
    <li>电子地图</li>
    <li>网上车管所</li>
    </ul>
    </div>    
    
    <div class="l1 l2">
    <h1><a href="#"><img src="images/cxx_10.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    </ul>
    </div> 
    
    
    <div class="l1 l3">
    <h1><a href="#"><img src="images/cxx_12.png" border="0" /></a></h1>
    <ul>
    <li>业务指南</li>
    <li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
    <li>自助报名</li>
    <li>模拟考场</li>
    <li>电子地图</li>
    <li>网上车管所</li>
    </ul>
    </div> 
    <div class="l1 l4">
    <h1><a href="#"><img src="images/cxx_14.png" border="0" /></a></h1>


    <div class="video"><img src="images/cxx_15.png" /></div>
    <div class="video"><img src="images/cxx_16.png" /></div>
    </div> 
    <div class="kjc">
    <img src="images/cxx_17.png" />
    </div>
    </td>
    <td valign="top">
    <div class="content">
    <h1>在线查询 / 电子警察拍照信息</h1>
    <table width="100%" border="0" cellspacing="0" cellpadding="0" class="tab">
    
    
    <tr>
    <td width="30" height="30" class="center_td">&nbsp;</td>
    <td width="140" class="center_td">电子警察拍照信息</td>
    <td width="200" class="center_td">小型汽车</td>
    <td class="center_td">辽AQ007B</td>
    </tr>
    <tr>
    <td class="center_td" height="30">序&nbsp;号</td>
    <td class="center_td">违法时间</td>
    <td class="center_td" width="200">违法地点</td>
    <td class="center_td">违法行为</td>
    </tr>


<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">
    <td class="center_td" height="30">1</td>
    <td class="center_td">2013-02-0711:16</td>
    <td>&nbsp;沈阳市永安路</td>
    <td>&nbsp;违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
  </tr>
  
<tr bgcolor="#e5e5e5" onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#e5e5e5';">

    <td class="center_td" height="30">2</td>
    <td class="center_td">2013-03-0808:34</td>
    <td>&nbsp;沈阳市三好街文萃路由南向北</td>
    <td>&nbsp;通过路口遇停止信号时,停在停止线以内或路口内的</td>
  </tr>
  

<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">
    <td class="center_td" height="30">3</td>
    <td class="center_td">2013-03-2210:16</td>
    <td>&nbsp;沈阳市三好街文萃路4号</td>
    <td>&nbsp;违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
  </tr>
  
<tr bgcolor="#e5e5e5" onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#e5e5e5';">

    <td class="center_td" height="30">4</td>
    <td class="center_td">2013-05-1413:53</td>
    <td>&nbsp;沈阳市永安路</td>
    <td>&nbsp;违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
  </tr>
  

<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">


    <td class="center_td" height="30">5</td>
    <td class="center_td">2013-05-3113:29</td>
    <td>&nbsp;沈阳市五里河街</td>
    <td>&nbsp;违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
  </tr>
  
  
  
    
  
</table>

    <table width="100%" height="43" border="0" cellpadding="0" cellspacing="0">
      <tr>
        <td width="121"><!-- <img src="images/cxx_07.png" width="121" height="24" /> --></td>
        <td width="176"><!-- <img src="images/cxx_08.png" width="176" height="24" /> --></td>
        <td width="176"><!-- <img src="images/cxx_09.png" width="133" height="24" /> --></td>
        <td align="right">
        <img src="images/bk.png" style="cursor:hand;" onclick="javascript:history.back(-1);" />
        </td>
      </tr>
    </table>
    </div>
    </td>
  </tr>
</table>


</div>
<div class="foot">
<p>友情连接:<select name="">
  <option>所属单位</option>
</select>
  <select name="select">
    <option>所属单位</option>
  </select>
  <select name="select2">
    <option>所属单位</option>
  </select>
  <select name="select3">
    <option>所属单位</option>
  </select>
  <select name="select4">
    <option>所属单位</option>
  </select>
</p>
Copyright 2009 www.sygajj.gov.cn All Rights Reserved<br />

版权所有:沈阳市交通警察支队 E-maill:webmaster@www.sygajj.gov.cn 辽ICP备07501079号 邮编:110003<br />

站长统计</div>
</body>
</html>


[解决办法]
preg_match_all('#<td class="center_td" height="30">(\d+)</td>\s*<td class="center_td">(.+)</td>\s*<td>&nbsp;(.+)</td>\s*<td>&nbsp;(.+)</td>#isU',$s,$m);

热点排行