关于preg_match_all的抓取
<div>
<h1>标题1</h1>
<p>内容1</p>
<p>内容2</p>
<h1>标题2</h1>
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
<p>内容4</p>
<h1>标题3</h1>
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);
$m = explode('<h1>', substr($m[1][0], 5));
foreach($m as $x)
echo htmlspecialchars ("<h1>$x") . '<br/>';