python中正则表达式提取网页中内容解决思路

2014-01-17

python中正则表达式提取网页中内容我想要抓取的是Microsoft1和Microsoft2 ，还有想抓取1和想抓取2我的正则

python中正则表达式提取网页中内容

我想要抓取的是Microsoft1和Microsoft2 ，还有想抓取1和想抓取2
我的正则如下为什么抓取不到呢请大神帮忙修改下
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>')
m=re.findall(r1,s)
s=
<td>

Microsoft1 

Microsoft2 

</td>

<td>

想抓取1
 

 

想抓取2 

</td>

[解决办法]
你还真是到处撒网啊。
r1=re.compile(r'<td>(?!<span)\s*(.*?)\s*<\/td>',re.S)

热点排行

请问一个python调用其他程序运行出错的有
正则表达式求解解决方法
[Lua] 怎么返回一个table给C程序
python新手关于类属性的有关问题
ubuntu12下怎么安装python3.2对应版本的
[Lua]表的下标引用有关问题
python类型转换有关问题
python下划线定名
求解正则表达式解决思路
将要崩溃了 awk 的 print中难道不可以用

perl python

python中正则表达式提取网页中内容解决思路