python re模块详解,python中re模块的用法

  python re模块详解,python中re模块的用法

  在python中,当需要通过正则表达式匹配字符串时,可以使用Python拥有的名为re的模块。下面这篇文章主要介绍Python使用re模块进行正则表达式运算的相关信息,有需要的朋友可以参考一下。

  一、前言二。匹配字符串1。使用match()方法2进行匹配。使用search()方法3进行匹配。与findall()方法3匹配。更换琴弦4。用正则表达式拆分字符串进行汇总。

  

目录

  Python中提供了re模块,用来实现正则表达式的运算。在实现过程中,可以使用re模块提供的方法(如search()、match()、findall()等。)来处理字符串,也可以使用re模块的compile()方法将模式字符串转换成正则表达式对象,然后使用正则表达式对象的相关方法来操作字符串。

  如果使用时没有引入re模块,则会抛出异常,如图所示:

  

一、前言

  匹配字符串可以使用re模块提供的match()、seardch()和findall()等方法。

  

二、匹配字符串

  Match()方法用于从字符串的开头开始匹配。如果一开始匹配成功,则返回match对象,否则返回None。语法格式如下:

  重新匹配(模式,字符串,[标志])

  参数说明:

  Pattern:表示模式字符串,由要匹配的正则表达式转换而来。String:表示要匹配的字符串。flags:可选参数,指示标志位,用于控制匹配方法,如字母是否区分大小写。的常用标志如表所示:标志表示A或ASCII只对w、W、b、d、s和S进行ASCII匹配(仅适用于Python3。X)I或IGNORECASE执行不区分大小写的匹配M或MULTILINE对包括整个字符串的开头和结尾在内的每一行使用$和$ s(仅适用于整个字符串的开头和结尾)s或DOTALL应用(。)字符匹配所有字符,包括换行符x或VERBOSE。忽略模式字符串中未转义的空格和注释。例如,匹配字符串是否以“mr_”开头是不区分大小写的,代码如下:

  进口re

  Pattern=rmr_w #模式匹配字符串

  String=MR_SHOP mr_shop #要匹配的字符串

  Match=re.match (pattern,string,re.i) #匹配不区分大小写的字符。

  打印(匹配)#输出匹配结果

  String=项目名称MR_SHOP mr_shop

  Match=re.match (pattern,string,re.i) #匹配不区分大小写的字符。

  打印(匹配)#输出匹配结果

  执行结果如下:

  从上面的执行结果可以看出,字符串 MR_SHOP 以“mr_”开头,所以返回一个match对象,而字符串“项目名MR_SHOP”不以“mr_”开头,会返回“None”。这是因为match()方法从字符串的开头开始匹配。当第一个字母不符合条件时,再次不匹配,直接返回None。

  Match对象包含匹配值和匹配数据的位置,其中:

  要获取匹配值的起始位置可以使用Match对象的start()方法;

  • 要获得匹配值的结束位置可以使用end()方法;
  • 通过span()方法可以返回匹配位置元组;
  • 通过string属性可以获取要匹配的字符串
  •   代码如下:

      

    import re

      pattern = r"mr_w+" # 模式匹配字符串

      string = "MR_SHOP mr_shop" # 要匹配的字符串

      match = re.match(pattern, string, re.I) # 匹配字符,不区分大小写

      print("匹配值的起始位置", match.start())

      print("匹配值的结束位置", match.end())

      print("匹配位置元组", match.span())

      print("要匹配的字符串", match.string)

      print("匹配数据", match.group())

      

      执行结果如下:

      

      

      

    2.使用search()方法进行匹配

      search()方法用于在整个字符串搜索第一个匹配值,如果匹配成功,则返回match对象,否则返回None,语法格式如下:

      

    re.search(pattern, string, [flags])

      

      参数说明:

      

    • pattern:表示模式字符串,由要匹配的正则表达式转换而来
    • string:表示要匹配的字符串
    • flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

      例如,所示一个以mr_开头的字符串,不区分大小写,代码如下:

      

    import re

      pattern = r"mr_w+" #模式匹配字符串

      string = "MR_SHOP mr_shop" #要匹配的字符串

      match = re.search(pattern,string,re.I)#匹配字符,不区分大小写

      print(match) #输出匹配结果

      string = "项目名称MR_SHOP mr_shop"

      match = re.search(pattern,string,re.I)#匹配字符,不区分大小写

      print(match) #输出匹配结果

      

      执行结果如下:

      

      从上面运行结果中可以看出,search()方法不仅仅是在字符串的起始位置搜索,其他位置有符合的匹配也可以。

      

      

    3.使用findall()方法进行匹配

      findall()方法用于整个字符串中的搜索所有符合正则表达式的字符串,并以列表的形式返回,如果匹配成功,则返回包含匹配结构的列表,否则返回空列表。其语法格式如下:

      

    re.findall(pattern, string, [flags])

      

      参数说明:

      

    • pattern:表示模式字符串,由要匹配的正则表达式转换而来
    • string:表示要匹配的字符串
    • flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

      例如,所示一个以mr_开头的字符串,不区分大小写,代码如下:

      

    import re

      pattern = r"mr_w+" #模式匹配字符串

      string = "MR_SHOP mr_shop" #要匹配的字符串

      match = re.findall(pattern,string,re.I)#匹配字符,不区分大小写

      print(match) #输出匹配结果

      string = "项目名称MR_SHOP mr_shop"

      match = re.findall(pattern,string,re.I)#匹配字符,不区分大小写

      print(match) #输出匹配结果

      

      执行结果如下:

      

      如果在指定的模式字符串中,包含分组,则返回与分组匹配的文本列表。例如:

      

    import re

      pattern = r"[1-9]{1,3}(.[0-9]{1,3}){3}" # 模式字符串

      str1 = "127.0.0.1 192.168.1.66" # 要匹配的字符串

      match = re.findall(pattern, str1) # 进行模式匹配

      print(match)

      

      执行结果如下:

      

      从上面结果中可以看出,并没有得到匹配的IP地址,这是因为在模式字符串中出现了分组,所以得到的结果是根据分组进行匹配的结果,即(.[0-9]{1,3})匹配的结果。如果想获取整个模式字符串的匹配,可以将整个模式字符串使用一对小括号进行分组,然后再获取结果时,只取返回值列表的每个元素(是一个元组)的第1个元素。代码如下:

      

    import re

      pattern = r"([1-9]{1,3}(.[0-9]{1,3}){3})" # 模式字符串

      str1 = "127.0.0.1 192.168.1.66" # 要匹配的字符串

      match = re.findall(pattern, str1) # 进行模式匹配

      for item in match:

       print(item[0])

      

      执行结果如下:

      

      

      

    三、替换字符串

      sub()方法用于实现字符串替换,语法格式如下:

      

    re.sub(pattern, sep1, string, count, flags)

      

      参数说明:

      

    • pattern:表示模式字符串,由要匹配的正则表达式转换而来
    • sep1:表示替换的字符串
    • string:表示查找要被替换的原始字符串
    • count:可以参数,表示模式匹配后替换
    • flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

      

    import re

      pattern = r"1[34578]d{9}" # 定义要替换的模式字符串

      string = "中奖号码为:84978981 联系电话为:13611111111"

      result = re.sub(pattern, "1xxxxxxxxxx", string)

      print(result)

      

      执行结果如下:

      

      

      

    四、使用正则表达式分割字符串

      splist()方法用于实现根据正则表达式分割字符串,并以列表的形式返回,其作用与字符串对象的splist()方法类似,所不同的就是分割字符由模式字符串指定。语法格式如下:

      

    re.splist(pattern, string, [maxsplist], [flags])

      

      参数说明:

      

    • pattern:表示模式字符串,由要匹配的正则表达式转换而来
    • string:表示要匹配的字符串
    • maxsplist:可选参数,表示最大的拆分次数。
    • flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

      例如:从给定的URL地址中提取出请求地址和各个参数,代码如下:

      

    import re

      pattern = r"[?&]" # 定义分割符

      url = http://www.baidu.com/login.jsp?username="mr"&pwd="mrsoft"

      result = re.split(pattern, url) # 分割字符串

      print(result)

      

      执行结果如下:

      

      

      

    总结

      到此这篇关于Python使用re模块实现正则表达式操作的文章就介绍到这了,更多相关Python使用re模块正则表达式内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!

    郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

    留言与评论(共有 条评论)
       
    验证码: