正则表达式截取html
1.现有超链接如下:<a href="products/F0/food/----------------------20----OFFSET5/2.html " rel="nofollow">Next</a>
实现效果:截取超链接Next对应的href。
2.现有表格如下
<table class="table-1">
<tr>
<th>Name</th>
</tr>
<tr>
<th>Address</th>
</tr>
<tr>
<th>Telephone</th>
</tr>
</table>
实现效果:截取<th>Name</th>所在的<tr>
注:请使用正则表达式(在C#中运行)
[解决办法]
C# 正则:
1. (?i)(?<=<a\b[^>]*?href=(['"]?))[^'"]+(?=\1[^>]*?>Next</a>)
2. (?is)<tr>.*?<th>Name</th>.*?</tr>
js正则:
1. var reg=/<a\b[^>]*?href=(['"]?)([^'"]+)\1[^>]*?>Next<\/a>/i; 取分组2的值
2. var reg=/<tr>.*?<th>Name<\/th>.*?<\/tr>/i;