首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > .NET > VB Dotnet >

文本框中的HTML源代码,怎么提取相关数据

2012-02-26 
文本框中的HTML源代码,如何提取相关数据?ulliclass li2 作者:中里巴人 著 /lili 出版社:中国

文本框中的HTML源代码,如何提取相关数据?
<ul>
<li   class= "li2 "> 作者:中里巴人 著 </li>
<li> 出版社:中国中医药出版社 </li>
<li> 出版日期:2007-2-1 </li>
<li> ISBN:9787800892080 </li>
<li> 字数:228000 </li>
<li> 印次:1 </li>
<li> 版次:1 </li>
<li     class= "li2 "> 纸张:胶版纸 </li>
</ul>
----------------------------------
以上为文本框内HTML代码,想写一段程序,执行后每一行赋给一个变量,最后输出如下结果:

作者:中里巴人 著
出版社:中国中医药出版社
出版日期:2007-2-1
ISBN:9787800892080
字数:228000
印次:1
版次:1
纸张:胶版纸




[解决办法]
Dim str As String = RichTextBox1.Text
Dim m As System.Text.RegularExpressions.Match
Dim mc As System.Text.RegularExpressions.MatchCollection
mc = System.Text.RegularExpressions.Regex.Matches(str, "(? <content> (? <= <li[^> ]*> )[\s\S]*?(?= </li> )) ", System.Text.RegularExpressions.RegexOptions.IgnoreCase)

For Each m In mc
MessageBox.Show(m.Groups( "content ").Value)
Next

热点排行