正则表达式简介

时间:2021-12-09 19:45:48

什么是正则表达式
正则表达式(Regular Expression)是一种文本模式,在编写处理字符串的程序或网页时,经常会有查找符合某些规则的字符串的需求。正则表达式就是用于描述这些规则的工具,换句话说,正则表达式就是记录文本规则的代码。

一、正则表达式常用字符

* 常用元字符*

  1. . 匹配除换行符以外的任意字符。
  2. \w 匹配字母、数字、下划线。
  3. \s 匹配任意的空白符。
  4. \d 匹配数字。
  5. \b 匹配单词的开始或结束。匹配符合表达式规则,并且以英文单词的形式出现(前后有空格)。如:var reg = /abc\b/; 匹配”abc 123 abc abcdey abc”,结果为:abc abc。
  6. ^ 匹配字符串的开始(从字符串的第一个字符开始匹配),如果不指定开始和结束,将匹配字符串中任意位置的字符。如:var reg = /[1-9]{1,}/; 匹配”abc12345dey”,结果为:12345。
  7. $ 匹配字符串的结束(匹配到字符串的最后一个字符)。

常用限定符

  • 重复零次或多次。
  • 重复一次或多次。
    ? 重复零次或一次。
    {n} 重复 n次。
    {n,} 重复 n次或多次。
    {n,m} 重复 n次到m次。

    常用反义词
    \W 匹配任意不是字母,数字,下划线,汉字的字符。
    \S 匹配任意不是空白的字符。
    \D 匹配任意非数字的字符。
    \B 匹配不是单词开头或结束的位置。
    [^x] 匹配除了x以外的任意字符。
    [^aeiou]匹配除了aeiou这几个字母以外的任意字符。

特殊字符”\”
1) 该字符可以将元字符转义为常量,例如:”.”,将元字符”.”,转为义为常量”.”。
2) 该字符还可以将常量转义为元字符,例如:”\w”,将常量”w”,转为义为元字符”\w”。

正则表达式修饰符
1) /g 表示该表达式将用来在输入字符串中查找所有可能的匹配,返回的结果可以是多个,如果不加/g最多只会匹配一个。
2) /i 表示匹配字符串时不区分大小写。
3) /m 表示多行匹配。什么是多行匹配呢?就是匹配换行符两端的潜在匹配,映象正则中^$符号。

示例
1) 使用 [] 限定范围
[abc] 字符串中某个字符出现表达式中,则匹配成功。例如匹配”1a2b3c”,结果为:a b c。
[a-z1-9]] 字符串中某个字符出现表达式的范围中,则匹配成功。例如匹配”ahzAZ0139@”,结果为:a h z 1 3 9。
[a-zA-Z0-9] 字符串中某个字符出现表达式的范围中,则匹配成功。例如匹配”ahzAZ0139@”,结果为:a h z A Z 0 1 3 9。

2) 使用 (|) 限定组
Window(95|98|NT|2000) 某个字符串匹配正则表达式中的多个分组,例如匹配”Window95WindowWindow98window98WindowNT”,结果为:Window95 Window98 WindowNT。

3) 匹配中文
[^x00-xff]{1,} 匹配中文字符串,例如匹配”啊1a看.~!@# % &*(),./ {}-+。匹配不准确!
[\u4e00-\u9fa5]{1,} 匹配中文字符串,例如匹配”啊1a看.~!@#$%^&*(),./][{}-+”,结果为:啊 看。匹配准确!