求正则表达式的写法
现在我需要提取链接地址,话不多说了,看现在的内容:
<a href="thread-1676621-1-1.html" target="_blank">xxxxxxxxx</a>
<a href="thread-1672952-1-1.html" style="font-weight: bold;color: #ee1b2e" target="_blank">xxxxxxx</a>
基本上就分类这2类链接,我想用正则,取出 ahref="" 引号里的地址。
自己弄了一个,把 style=后面的也给取出来了。但又不会过滤。
恳请熟悉正则的朋友帮我写一个。如果有时间把结果讲解一下,那更好了。没有就算了。
多谢。
[解决办法]
'---------------------------------------------------' 过程名 : RegExpHref' 时间 : 2010-4-18 18:58' 作者 : 杨过.网狐.cn(csdn bcrun)' 功能 : 提取html文件中<a href=""里的网址部分' 说明 :' 备注 : http://topic.csdn.net/u/20100418/18/79782b7b-13f4-4976-8aee-8b452f47f17e.html'求正则表达式的写法'---------------------------------------------------'Function RegExpHref() As String Dim regEx, vMatch As Match, Matches ' Create variable. ' Dim RetStr As String, strSubValue As String, strText As String Dim str原文 As String str原文 = "<a href=""thread-1676621-1-1.html"" target=""_blank"">xxxxxxxxx</a>" & vbCrLf & _ "<a href=""thread-1672952-1-1.html"" style=""font-weight: bold;color: #ee1b2e"" target=""_blank"">xxxxxxx</a>" ' Set regEx = New RegExp ' 创建一个RegExp对象,前期绑定,需引用库Microsoft VBScript Regular Expressions 5.5 Set regEx = CreateObject("VBScript.RegExp") '后期绑定 regEx.Pattern = "<a href=""([^""]+)""" '设置pattern. regEx.IgnoreCase = True '忽略大小写. regEx.Global = True Set Matches = regEx.Execute(str原文) ' Execute search. For Each vMatch In Matches ' Iterate Matches collection. Debug.Print vMatch.SubMatches(0) 'Pattern里()中的匹配的项 NextEnd Function