首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > asp.net >

求正则表达式循环提取链接,标题,时间!解决方法

2012-03-20 
求正则表达式循环提取链接,标题,时间!HTML codelia href链接alt标题img alt标题 srcc.gif

求正则表达式循环提取链接,标题,时间!

HTML code
<li><a href="链接"alt="标题"><img alt="标题" src="c.gif" width="6" height="7"/>标题</a><span class="list_content_time">时间</span><span class="list_content_read">点击</span></li><li><a href="链接"alt="标题"><img alt="标题" src="c.gif" width="6" height="7"/>标题</a><span class="list_content_time">时间</span><span class="list_content_read">点击</span></li><li><a href="链接"alt="标题"><img alt="标题" src="c.gif" width="6" height="7"/>标题</a><span class="list_content_time">时间</span><span class="list_content_read">点击</span></li><li><a href="链接"alt="标题"><img alt="标题" src="c.gif" width="6" height="7"/>标题</a><span class="list_content_time">时间</span><span class="list_content_read">点击</span></li>



请教以上内容如何用正则表克式循环提取所有的链接、标题、时间?

以前我提取是这样提取的
C# code
                Regex reg = new Regex(@"(?is)<a(?:(?!href=).)*href=(['""]?)(?<url>[^""\s>]*)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");                MatchCollection mc = reg.Matches(li.OuterHtml);                foreach (Match m in mc)                {        string url = m.Groups["url"].Value;                    string c = Type(m.Groups["text"].Value).ToString();                    }                }


但现在正则试不对了,也循环不了,求教!

[解决办法]
C# code
        string s = @"<li><a href=""链接""alt=""标题""><img alt=""标题"" src=""c.gif"" width=""6"" height=""7""/>标题</a><span class=""list_content_time"">时间</span><span class=""list_content_read"">点击</span></li><li><a href=""链接""alt=""标题""><img alt=""标题"" src=""c.gif"" width=""6"" height=""7""/>标题</a><span class=""list_content_time"">时间</span><span class=""list_content_read"">点击</span></li><li><a href=""链接""alt=""标题""><img alt=""标题"" src=""c.gif"" width=""6"" height=""7""/>标题</a><span class=""list_content_time"">时间</span><span class=""list_content_read"">点击</span></li><li><a href=""链接""alt=""标题""><img alt=""标题"" src=""c.gif"" width=""6"" height=""7""/>标题</a><span class=""list_content_time"">时间</span><span class=""list_content_read"">点击</span></li>";        MatchCollection matches = Regex.Matches(s, @"(?is)<li><a href=""(?<href>.*?)""[^>]*><img[^>]*/>(?<title>.*?)</a><span[^>]*>(?<time>.*?)</span>.*?</li>");        foreach (Match match in matches)        {            Response.Write(match.Groups["href"].Value + "<br/>");            Response.Write(match.Groups["title"].Value + "<br/>");            Response.Write(match.Groups["time"].Value + "<hr/>");        } 

热点排行