爬虫的正则表达式相关，两个一样的标签怎么抓第二个

2019-08-09 13:17发布

站内文章 / Python

158 0

混吃等死

女 | 书童

私信

问题:

这个是网站上的标签

<td style="color:#458c3f; font-size:14px; font-weight:bold; padding-top:15px; padding-bottom:8px;" align="center" class="">环境影响评价文件受理公示—镇江盛润建材有限公司年产6万立方米混凝土砌块砖项目（报告表）（京口区环保局）</td>

有一个一样的align在前面，抓取的话总是抓到第一个

我是这么写的

title = extract_fields(r'<td align="center">(.*?)</tr>', datas,re.S) # 匹配标题

有什么办法只抓第二个吗？

回答1:

title = extract_fields(r'<td style="color:#458c3f; font-size:14px; font-weight:bold; padding-top:15px; padding-bottom:8px;" align="center">(.*?)</td>', datas,re.S) # 匹配标题

全丢上去抓到了...