在学习网络爬虫的过程中,需要抓取网页的评论数,涉及到正则表达式,便顺便看了看。正则表达式是文字处理中常用的工具。

1正则表达式的常用字符串

.       任何单个字符

【】 字符集对单个字符给出取值范围

【^】非字符集

*      前一个字符重复0或多次

+     前一个字符重复1或多次

?    前一个字符重复0或1次

|      或者

{m}  前一个字符扩展m次

{m,n}前一个字符扩展m至n次

^      匹配字符串开头

$      匹配字符串结束

\d     【0-9】

\w      单词字符

2主要功能函数

import re     #导入re包
m=re.search(pattern,string) #搜索整个字符串,直到发现符合的字符串
m=re.match(pattern,string) #从字符串的开始位置匹配正则表达式,返回结果
m=re.sub(pattern,replacement,string)#从字符串中查找并替换
m=re.findall() #搜索字符串,将所有符合的子字符串放在一个表中返回
m=re.finditer() #返回一个匹配结果的迭代类型,每个迭代元素是match对象
m=re.split() #将一个字符串按照正则表达式匹配结果进行分割,返回列表类型

re.group(number) 查看搜索到的结果,group(0)是整个表达式的搜索结果,,group(1)是第一个群,以此类推。

最新文章

  1. 无限分级和tree结构数据增删改【提供Demo下载】
  2. SQL Server 在多个数据库中创建同一个存储过程(Create Same Stored Procedure in All Databases)
  3. Checkstyle:整洁你的代码
  4. 【转】slice,substr和substring的区别
  5. three.js右手坐标系, 显示和线条
  6. 进程控制之exec函数
  7. 分享一个自己写的基于TP的关系模型
  8. CSU1661: Query Mutiple
  9. IEEE浮点数float、double的存储结构
  10. disruptor流程
  11. 重新想象 Windows 8 Store Apps (25) - 选取器: 文件选取窗口, 文件夹选取窗口, 文件保存窗口
  12. c语言项目开发流程一部曲
  13. 原生 js 实现点击按钮复制文本
  14. (转)理解CPU steal time
  15. android开发学习笔记系列(4)--android动态布局
  16. Ubuntu菜鸟入门(十四)—— 设置root密码
  17. Spring Cloud构建微服务架构(七)消息总线
  18. 关于MUI v0.18.0版本 Table组件里的复选框不能选的解决方案
  19. Web前端开发笔试&面试_01(mi:)
  20. CentOS 7 named配置forward

热门文章

  1. Text ------widget树由两个widget:Center(及其子widget)和Text组成
  2. MySQL中select、insert、update批量操作语句
  3. 关于display的属性:block和inline-block以及inline的区别,float相关说明
  4. kali虚拟机添加共享文件夹
  5. python之做一个简易的翻译器(二)
  6. 规则引擎 drools
  7. [数据结构] 2.7 Heap 堆
  8. SmartGit 常见错误提示代码
  9. echarts常用方法,饼图切换圆环中文字(三)
  10. 解决移动端真机不能下拉滚动bug