首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > perl python >

正则婚配取某段汉字

2013-10-23 
正则匹配取某段汉字div classweatherMaindiv classweatherLeftdiv classweatherToph1 cla

正则匹配取某段汉字

<div class="weatherMain">
  <div class="weatherLeft">
    <div class="weatherTop">
      <h1 class="weatheH1"  id="live">
        今天是2013年10月8日 星期二 农历九月初四
  
<!--today5-->

        <select class="weatherSelect" onchange="MM_jumpMenu('parent',this,0)">
          <option>相关地区</option>


求问:正则表达式如何写?才能取出“今天是2013年10月8日 星期二 农历九月初四”
要直接取出来,尽量不要二次处理字符串。
困难在于 <h1 class="weatheH1"  id="live">这个可以取出,但是不晓得如何取下一行,并且是汉字,而且前面有空格。
求教!
[解决办法]
用bs4来做吧
[解决办法]
一般来说,strip之类二次处理是少不免的,这个可以试试
re.findall(r'<h1[^>]+id="live">\s*([^<]+)\s*<', html, re.I)

热点排行