Python标准库01正则表达式
2023-11-24 01:53:07
在学习网络爬虫的过程中,需要抓取网页的评论数,涉及到正则表达式,便顺便看了看。正则表达式是文字处理中常用的工具。
1正则表达式的常用字符串
. 任何单个字符
【】 字符集对单个字符给出取值范围
【^】非字符集
* 前一个字符重复0或多次
+ 前一个字符重复1或多次
? 前一个字符重复0或1次
| 或者
{m} 前一个字符扩展m次
{m,n}前一个字符扩展m至n次
^ 匹配字符串开头
$ 匹配字符串结束
\d 【0-9】
\w 单词字符
2主要功能函数
import re #导入re包
m=re.search(pattern,string) #搜索整个字符串,直到发现符合的字符串
m=re.match(pattern,string) #从字符串的开始位置匹配正则表达式,返回结果
m=re.sub(pattern,replacement,string)#从字符串中查找并替换
m=re.findall() #搜索字符串,将所有符合的子字符串放在一个表中返回
m=re.finditer() #返回一个匹配结果的迭代类型,每个迭代元素是match对象
m=re.split() #将一个字符串按照正则表达式匹配结果进行分割,返回列表类型
re.group(number) 查看搜索到的结果,group(0)是整个表达式的搜索结果,,group(1)是第一个群,以此类推。
最新文章
- 无限分级和tree结构数据增删改【提供Demo下载】
- SQL Server 在多个数据库中创建同一个存储过程(Create Same Stored Procedure in All Databases)
- Checkstyle:整洁你的代码
- 【转】slice,substr和substring的区别
- three.js右手坐标系, 显示和线条
- 进程控制之exec函数
- 分享一个自己写的基于TP的关系模型
- CSU1661: Query Mutiple
- IEEE浮点数float、double的存储结构
- disruptor流程
- 重新想象 Windows 8 Store Apps (25) - 选取器: 文件选取窗口, 文件夹选取窗口, 文件保存窗口
- c语言项目开发流程一部曲
- 原生 js 实现点击按钮复制文本
- (转)理解CPU steal time
- android开发学习笔记系列(4)--android动态布局
- Ubuntu菜鸟入门(十四)—— 设置root密码
- Spring Cloud构建微服务架构(七)消息总线
- 关于MUI v0.18.0版本 Table组件里的复选框不能选的解决方案
- Web前端开发笔试&;面试_01(mi:)
- CentOS 7 named配置forward
热门文章
- Text ------widget树由两个widget:Center(及其子widget)和Text组成
- MySQL中select、insert、update批量操作语句
- 关于display的属性:block和inline-block以及inline的区别,float相关说明
- kali虚拟机添加共享文件夹
- python之做一个简易的翻译器(二)
- 规则引擎 drools
- [数据结构] 2.7 Heap 堆
- SmartGit 常见错误提示代码
- echarts常用方法,饼图切换圆环中文字(三)
- 解决移动端真机不能下拉滚动bug