文本框中的HTML源代码，怎么提取相关数据

2012-02-26

文本框中的HTML源代码，如何提取相关数据？ulliclass li2 作者：中里巴人　著 /lili 出版社：中国

文本框中的HTML源代码，如何提取相关数据？
<ul>
<li class= "li2 "> 作者：中里巴人　著 </li>
<li> 出版社：中国中医药出版社 </li>
<li> 出版日期：2007-2-1 </li>
<li> ISBN：9787800892080 </li>
<li> 字数：228000 </li>
<li> 印次：1 </li>
<li> 版次：1 </li>
<li class= "li2 "> 纸张：胶版纸 </li>
</ul>
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
以上为文本框内HTML代码，想写一段程序，执行后每一行赋给一个变量，最后输出如下结果：

作者：中里巴人　著
出版社：中国中医药出版社
出版日期：2007-2-1
ISBN：9787800892080
字数：228000
印次：1
版次：1
纸张：胶版纸

[解决办法]
Dim str As String = RichTextBox1.Text
Dim m As System.Text.RegularExpressions.Match
Dim mc As System.Text.RegularExpressions.MatchCollection
mc = System.Text.RegularExpressions.Regex.Matches(str, "(? <content> (? <= <li[^> ]*> )[\s\S]*?(?= </li> )) ", System.Text.RegularExpressions.RegexOptions.IgnoreCase)

For Each m In mc
MessageBox.Show(m.Groups( "content ").Value)
Next

热点排行

VB Dotnet

文本框中的HTML源代码，怎么提取相关数据