Python 匹配 HTML tag 的时候，＜.＞和＜.?＞区别

飞熊 • 2023年5月10日下午10:55 • 后端笔记 • 阅读 269

命运对每个人都是一样的，不一样的是各自的努力和付出不同，付出的越多，努力的越多，得到的回报也越多，在你累的时候请看一下身边比你成功却还比你更努力的人，这样，你就会更有动力。

导读：本篇文章讲解 Python 匹配 HTML tag 的时候，＜.*＞和＜.*?＞区别，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

二者区别：

<.*>是贪婪匹配，会从第一个“<”开始匹配，直到最后一个“>”中间所有的字符都会匹配到，中间可能会包含 “<>”。
<.*?>是非贪婪匹配，从第一个“<”开始往后，遇到第一个“>”结束匹配，这中间的字符串都会匹配到，但是不会有“<>”。

在形式上非贪婪模式有一个“？”作为该部分的结束标志。

在功能上贪婪模式是尽可能多的匹配当前正则表达式，可能会包含好几个满足正则表达式的字符串，非贪婪模式，在满足所有正则表达式的情况下尽可能少的匹配当前正则表达式。

示例代码：

import re

s = "<html><head><title>MyPageTitle</title></head><body><table><tr><th>AAAAAA</th></tr><tr><td>BBBBBB</td></tr><tr><td>CCCCCC</td></tr><tr><td>DDDDDDD</td></tr></table></body></html>"

res = re.findall(r'<tr>(.*?)</tr>', s)[0]
print(res)
res = re.findall(r'<tr>(.*)</tr>', s)[0]
print(res)
res = re.findall(r'<tr>(.?)</tr>', s)
print(res)

运行结果：

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/142766.html

赞 (0)

0 0

后端笔记

凯撒密码 | 加密解密

000259

飞熊
2023年12月26日
后端笔记

（C语言代码分享）：车辆信息管理系统源代码来了。

000209

seven_
2023年2月28日
后端笔记

优化多线程数据访问，避免重复访问

000275

飞熊
2023年12月11日
后端笔记

Java数据结构与算法分析

000180

飞熊
2023年3月4日
后端笔记

一小段经历后的感想和自述。

000309

seven_
2023年2月28日
后端笔记

从控制台输入整数年，计算并输出1-12月的月历

000223

seven_
2023年2月28日
后端笔记

获取 /resources 目录资源文件的 9 种方法

000195

飞熊
2023年3月8日
后端笔记

Java基础-枚举类

000215

飞熊
2023年12月26日
后端笔记

计算机图形学08：中点BH算法绘制抛物线（100x = y^2）

000226

飞熊
2023年4月6日
后端笔记

【LeetCode】3. 无重复字符的最长子串 – Go 语言题解

000232

seven_
2023年2月26日
后端笔记

聊聊优化分页查询带来的思考

000306

小半
2024年3月18日
后端笔记

Spring Boot中的bean注入方式和原理

000256

飞熊
2023年4月20日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！