简单php采集网页部分文字问题,求指点,多谢
本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑 目标采集页面如下代码(示例页面,数据可能变化,但格式不会变化)
要求得到table中主要的4项数据:序 号、违法时间、违法地点、违法行为(即93行~130行之间的)
希望能给出详细一点的php代码。
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<base href="http://218.25.58.44:80/" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>交警查询</title>
<link href="style/style.css" rel="stylesheet" type="text/css" />
<style>
.center_td {
text-align:center;
}
</style>
</head>
<body>
<div class="top">
<div class="menu"><ul><li><a href="#">网站首页</a></li><li> 沈阳交警</li><li> 交通新闻 </li><li> 视频播放 </li><li> 为您服务 </li><li> 在线办公 </li><li> 信息查询 </li><li> 征求意见 </li><li> 联系我们</ul>
</div>
<div class="txt"><!-- 沈阳小雨转小到中雨21~14 今天是:2010年5月28日 -->返回首页 / 设为首页 / 添加搜藏</div>
</div>
<div class="main">
<table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td valign="top" class="lmenu" >
<div class="l1">
<h1><a href="#"><img src="images/cxx_04.png" border="0" /></a></h1>
<ul>
<li>业务指南</li>
<li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
<li>自助报名</li>
<li>模拟考场</li>
<li>电子地图</li>
<li>网上车管所</li>
</ul>
</div>
<div class="l1 l2">
<h1><a href="#"><img src="images/cxx_10.png" border="0" /></a></h1>
<ul>
<li>业务指南</li>
<li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
<li>自助报名</li>
</ul>
</div>
<div class="l1 l3">
<h1><a href="#"><img src="images/cxx_12.png" border="0" /></a></h1>
<ul>
<li>业务指南</li>
<li>表格下载<br />
机动车驾驶人身体条件证<br />
机动车驾驶申请表…</li>
<li>自助报名</li>
<li>模拟考场</li>
<li>电子地图</li>
<li>网上车管所</li>
</ul>
</div>
<div class="l1 l4">
<h1><a href="#"><img src="images/cxx_14.png" border="0" /></a></h1>
<div class="video"><img src="images/cxx_15.png" /></div>
<div class="video"><img src="images/cxx_16.png" /></div>
</div>
<div class="kjc">
<img src="images/cxx_17.png" />
</div>
</td>
<td valign="top">
<div class="content">
<h1>在线查询 / 电子警察拍照信息</h1>
<table width="100%" border="0" cellspacing="0" cellpadding="0" class="tab">
<tr>
<td width="30" height="30" class="center_td"> </td>
<td width="140" class="center_td">电子警察拍照信息</td>
<td width="200" class="center_td">小型汽车</td>
<td class="center_td">辽AQ007B</td>
</tr>
<tr>
<td class="center_td" height="30">序 号</td>
<td class="center_td">违法时间</td>
<td class="center_td" width="200">违法地点</td>
<td class="center_td">违法行为</td>
</tr>
<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">
<td class="center_td" height="30">1</td>
<td class="center_td">2013-02-0711:16</td>
<td> 沈阳市永安路</td>
<td> 违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
</tr>
<tr bgcolor="#e5e5e5" onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#e5e5e5';">
<td class="center_td" height="30">2</td>
<td class="center_td">2013-03-0808:34</td>
<td> 沈阳市三好街文萃路由南向北</td>
<td> 通过路口遇停止信号时,停在停止线以内或路口内的</td>
</tr>
<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">
<td class="center_td" height="30">3</td>
<td class="center_td">2013-03-2210:16</td>
<td> 沈阳市三好街文萃路4号</td>
<td> 违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
</tr>
<tr bgcolor="#e5e5e5" onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#e5e5e5';">
<td class="center_td" height="30">4</td>
<td class="center_td">2013-05-1413:53</td>
<td> 沈阳市永安路</td>
<td> 违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
</tr>
<tr onmouseover="this.style.background='#DAE5FB';" onmouseout="this.style.background='#ffffff';">
<td class="center_td" height="30">5</td>
<td class="center_td">2013-05-3113:29</td>
<td> 沈阳市五里河街</td>
<td> 违停,驾驶人不在现场,妨碍其他车辆行人通行的</td>
</tr>
</table>
<table width="100%" height="43" border="0" cellpadding="0" cellspacing="0">
<tr>
<td width="121"><!-- <img src="images/cxx_07.png" width="121" height="24" /> --></td>
<td width="176"><!-- <img src="images/cxx_08.png" width="176" height="24" /> --></td>
<td width="176"><!-- <img src="images/cxx_09.png" width="133" height="24" /> --></td>
<td align="right">
<img src="images/bk.png" style="cursor:hand;" onclick="javascript:history.back(-1);" />
</td>
</tr>
</table>
</div>
</td>
</tr>
</table>
</div>
<div class="foot">
<p>友情连接:<select name="">
<option>所属单位</option>
</select>
<select name="select">
<option>所属单位</option>
</select>
<select name="select2">
<option>所属单位</option>
</select>
<select name="select3">
<option>所属单位</option>
</select>
<select name="select4">
<option>所属单位</option>
</select>
</p>
Copyright 2009 www.sygajj.gov.cn All Rights Reserved<br />
版权所有:沈阳市交通警察支队 E-maill:webmaster@www.sygajj.gov.cn 辽ICP备07501079号 邮编:110003<br />
站长统计</div>
</body>
</html>