python中正则表达式提取网页中内容
我想要抓取的是Microsoft1和Microsoft2 ,还有想抓取1和想抓取2
我的正则如下 为什么抓取不到呢 请大神帮忙修改下
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>')
m=re.findall(r1,s)
s=
<td>
Microsoft1<br/>
Microsoft2<br/>
</td>
<td>
想抓取1
<br/>
<br/>
想抓取2<br/>
</td>
[解决办法]
你还真是到处撒网啊。
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>',re.S)