文本框中的HTML源代码,如何提取相关数据?
<ul>
<li class= "li2 "> 作者:中里巴人 著 </li>
<li> 出版社:中国中医药出版社 </li>
<li> 出版日期:2007-2-1 </li>
<li> ISBN:9787800892080 </li>
<li> 字数:228000 </li>
<li> 印次:1 </li>
<li> 版次:1 </li>
<li class= "li2 "> 纸张:胶版纸 </li>
</ul>
----------------------------------
以上为文本框内HTML代码,想写一段程序,执行后每一行赋给一个变量,最后输出如下结果:
作者:中里巴人 著
出版社:中国中医药出版社
出版日期:2007-2-1
ISBN:9787800892080
字数:228000
印次:1
版次:1
纸张:胶版纸
[解决办法]
Dim str As String = RichTextBox1.Text
Dim m As System.Text.RegularExpressions.Match
Dim mc As System.Text.RegularExpressions.MatchCollection
mc = System.Text.RegularExpressions.Regex.Matches(str, "(? <content> (? <= <li[^> ]*> )[\s\S]*?(?= </li> )) ", System.Text.RegularExpressions.RegexOptions.IgnoreCase)
For Each m In mc
MessageBox.Show(m.Groups( "content ").Value)
Next