求助:urllib2.urlopen使用的一个问题
我在chrome审查元素看到的是
<strong id="J_StrPrice" class="J_CurPrice">1099.00<strong>
为什么在urllib2.urlopen().read()后其中的1099.00消失了,只剩
<strong id="J_StrPrice" class="J_CurPrice"><strong>
具体链接在http://detail.tmall.com/item.htm?spm=a220m.1000858.1000725.1.eUay3R&id=24624448336&areaId=&user_id=713325132&is_b=1&cat_id=50047403&q=&rn=81a25a5e885ba85f0633706b9da34ad9&standard=1
求大神们指点该怎么才能找到那个1099.00 chrome urllib2
[解决办法]
价格应该是ajax读取的,单纯取html取不到
自己抓包再分析ajax的请求地址吧
[解决办法]
简言之:
还得靠你自己去:
用工具抓取内部逻辑,
然后搞清楚内部是如何生成,获得对应的你此处的1099.0的价格数字的。
如何用工具抓取,可以去看:
【教程】如何抓取动态网页内容
然后再去看一些示例:
【教程】以抓取网易博客帖子中的最近读者信息为例,手把手教你如何抓取动态网页中的内容
应该就会自己用工具抓取逻辑了。
其他内容,详见:
详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等)
如果还不会:
等我啥时候有空,再帮你具体去分析吧。