正则婚配取某段汉字
正则匹配取某段汉字div classweatherMaindiv classweatherLeftdiv classweatherToph1 cla
正则匹配取某段汉字
<div class="weatherMain">
<div class="weatherLeft">
<div class="weatherTop">
<h1 class="weatheH1" id="live">
今天是2013年10月8日 星期二 农历九月初四
<!--today5-->
<select class="weatherSelect" onchange="MM_jumpMenu('parent',this,0)">
<option>相关地区</option>
求问:正则表达式如何写?才能取出“今天是2013年10月8日 星期二 农历九月初四”
要直接取出来,尽量不要二次处理字符串。
困难在于 <h1 class="weatheH1" id="live">这个可以取出,但是不晓得如何取下一行,并且是汉字,而且前面有空格。
求教!
[解决办法]用bs4来做吧
[解决办法]一般来说,strip之类二次处理是少不免的,这个可以试试
re.findall(r'<h1[^>]+id="live">\s*([^<]+)\s*<', html, re.I)