首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > perl python >

python中正则表达式提取网页中内容解决思路

2014-01-17 
python中正则表达式提取网页中内容我想要抓取的是Microsoft1和Microsoft2 ,还有想抓取1和想抓取2我的正则

python中正则表达式提取网页中内容

我想要抓取的是Microsoft1和Microsoft2 ,还有想抓取1和想抓取2
我的正则如下 为什么抓取不到呢 请大神帮忙修改下
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>')  
m=re.findall(r1,s)
s=
<td>


Microsoft1<br/>

Microsoft2<br/>


</td>

<td>


想抓取1
<br/>


<br/>

想抓取2<br/>

</td>

[解决办法]
你还真是到处撒网啊。
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>',re.S)

热点排行