cgi提取文件内容?
<p>
<img alt="cgi提取资料内容" src= "/images/fangda.jpg" /> <a href="/product/viewbigpic.aspx?productid=476826"
target="_blank" title="查看分形算法与程序设计(附光盘VISUAL BASIC实现)的大图">查看大图 </a> </p>
<ul>
<li>商品评分: <span> <script type='text/javascript'>var r1 = new Stars({ maxRating: 5, value: 3, locked: true }); </script>( <span id="rateTimes">22 </span>人) </span> </li>
<li>我的评分: <span> <script type='text/javascript'>function rated(res) { r2.locked = true; $('rating_status').innerHTML='(已评)'; var t = res.responseText.split(', '); r1.changeValue(t[0]); $('rateTimes').innerHTML=t[1]; }var r2 = new Stars({ maxRating: 5, actionURL: '/Product/ProductRate.ashx?productid=476826&rating=', callback: rated }); </script> <span id='rating_status'>(未评) </span> </span> </li>
</ul>
</div>
<div id="proinfo">
<h5>
分形算法与程序设计(附光盘VISUAL BASIC实现) </h5>
<span>
</span>
<p>
<strong>
</strong> </p>
<p>
<a id="ctl00_ContentPlaceHolder1_PreviewLink" href="/Product/BookPreView.aspx? productId=476826" target="_blank">试读 </a>
</p>
<table cellpadding="0" cellspacing="0" width="100%">
<tr>
<td class="protab_1">
商品编号:
</td>
<td class="protab_2">
476826
</td>
<td class="protab_3">
</td>
</tr>
<tr>
<td>
ISBN:
</td>
<td>
703014540
</td>
<td>
</td>
</tr>
<tr>
<td>
市场价:
</td>
<td>
<span class="oneprice">
¥45.0 </span>
</td>
<td>
一星会员价:
</td>
<td>
<span>
¥38.3 </span> <span
class="pricezk">(85折) </span>
</td>
<td>
节省: <span>¥6.7 </span>
</td>
</tr>
</table>
<input type="hidden" name="__EVENTVALIDATION" id="__EVENTVALIDATION" value="/wEWAwL8lKjrCgKGo43OAgKAgN/0DihUlCqAQjCNDgAutGFERSRkwOvz" /> </form>
<div class="pronext">
<div id="ctl00_ContentPlaceHolder1_ProductDesc">
<h4>
商品介绍 </h4>
本书从实用的角度出发,论述了分形图形的生成算法与程序设计。内容包括分形图的递归算法、文法构图算法、迭代函数系统算法、逃逸时间算法、分形演化算法,以及分形图的放大、分形图的动画、分形图的立体化和利用分形算法实现自然景物的模拟等内容。 <br /> 本书共分10章,集中介绍了近年来分形图形学的研究成果,以通俗的语言总结出了相应的算法,并配有 Visual Basic程序设计源代码,使读者易学、易掌握、易用。只要具备高中的数学知识和Visual Basic程序设计能力,便可以轻松阅读此书。 <br /> 本书可供广大分形爱好者及数学、物理、计算机、
</div>
<h4>商品参数 </h4>
<div class="product_chanshu"> <p>
<div class="chanpinxinxileft">作者: </div> <div class="chanpinxinxiright">孙博文编 </div>
<div class="chanpinxinxileft">出版社: </div> <div class="chanpinxinxiright">科学出版社 </div>
<div class="chanpinxinxileft">出版日期: </div> <div class="chanpinxinxiright">2005-01 </div>
<div class="chanpinxinxileft">版次: </div> <div class="chanpinxinxiright">1 </div>
<div class="chanpinxinxileft">包装: </div> <div class="chanpinxinxiright">附带光盘 </div>
<div class="chanpinxinxileft">开本: </div> <div class="chanpinxinxiright">16开 </div>
<div class="chanpinxinxileft">页数: </div> <div class="chanpinxinxiright">392 </div>
<div class="chanpinxinxileft">字数: </div> <div class="chanpinxinxiright">566千 </div>
</p> </div>
<h4>特别推荐 </h4>
<div class="tebietuijian" id="__pro_tebietuijian">
<div>
<a href="/51097">
<img alt="cgi提取资料内容" src="http://image.welan.com/?51097" /> </a> <p>
<a href="/51097">入侵检测技术导论 </a> </p>
</div>
</div>
以上是我文件的内容,我想通过perl取道以下重要信息存入文件
分形算法与程序设计(附光盘VISUAL BASIC实现)#¥38.3孙博文编#科学出版社#2005-01#1#附带光盘#16#392#566千
小弟初学,在线等,请给出代码,谢谢
[解决办法]
写了自己没测试,你凑活着看吧,只是给你提供个思路,代码通不通过我自己都没试,也是初学者 呵呵
#!/usr/bin/perl
use Encode;
$file=./a.html;
$tag=0;
$tag1=0;
open (FILE ,"< $file");
while(<FILE>){
$temp=encode("utf8",decode("gbk",$_));
if($_ =~ '<h5>'){
tag=1;
}
if($tag==1){
open(FILE2 ,"> /usr/local/aa.txt")
[解决办法]
die "can\'t open the file";
@abc=split(/ /,$temp);
print FILE2 $abc[0].'\#';
}
if($temp=~'一星会员价'){
$_=<FILE>;
$_=<FILE>;
$_=<FILE>;
$tag1=1;
}
if($tag1==1 && $_=~'\¥'){
@price=split(/ /,$temp_);
print FILE2 $price[0].'\#';
$tag1==0;
}
if($temp=~'作者'){
@auth=split(/"chanpinxinxiright">/,$temp);
@auth2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'出版社'){
@publish=split(/"chanpinxinxiright">/,$temp);
@publish2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'出版日期'){
@date=split(/"chanpinxinxiright">/,$temp);
@date2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'版次'){
@mount=split(/"chanpinxinxiright">/,$temp);
@mount2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'包装'){
@baozhuang=split(/"chanpinxinxiright">/,$temp);
@baozhuang2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'开本'){
@kaiben=split(/"chanpinxinxiright">/,$temp);
@kaiben2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'页数'){
@pages=split(/"chanpinxinxiright">/,$temp);
@pages2=split(/ /,$auth[1]);
print FILE2 $auth2[0].'\#';
}
if($temp=~'字数'){
@words=split(/"chanpinxinxiright">/,$temp);
@words=split(/ /,$auth[1]);
print FILE2 $auth2[0];
}
}
close FILE;
close FILE2;