求助:如何利用C++(不包括VC)提取HTML中的链接??
如果有了一个网页的HTML源
想把里面有关链接的信息提取出来怎么做?
有高人指点下。
<a href= 'http://tech.sina.com.cn/ ' target=_blank> 新浪科技 </a> </td>
<td> <a href= 'http://it.sohu.com/ ' target=_blank> 搜狐IT </a> </td>
<td> <a href= 'http://tech.163.com/ ' target=_blank> 网易科技 </a> </td>
<td> <a href= 'http://www.it168.com/ ' target=_blank> IT168 </a> </td>
<td> <a href= 'http://www.thethirdmedia.com/ ' target=_blank> 第三媒体 </a> </td>
<td> <a href= 'http://digi.163.com/ ' target=_blank> 网易数码 </a> </td>
像上面这段就是 提取出只包含网页链接
[解决办法]
http://forums.microsoft.com/MSDN/ShowPost.aspx?PostID=1105716&SiteID=1
[解决办法]
不管什么语言都用正则表达式提取就行了。