Java 正则表达式详解及实用案例

时间:2024-11-17 15:51:40

Java 正则表达式详解及实用案例

正则表达式是一种强大的工具,用于处理字符串匹配和文本解析。在这篇博客中,我们将通过代码示例,详细讲解正则表达式的基本语法规则以及在Java中的实际应用

什么是正则表达式?

正则表达式(Regular Expression)是一种用来描述字符模式的规则。它可以用来验证字符串是否符合规则,或者从一段文本中提取特定的子字符串

正则表达式的典型应用:

  • 字符串校验(如校验手机号码、邮箱地址等)
  • 文本搜索与替换
  • 数据解析

Java 正则表达式的基本用法

在Java中,PatternMatcher类是处理正则表达式的核心。以下是几个关键概念和用法:

(1) 字符类

字符类用来匹配特定范围内的字符。以下是常见的字符类:

表达式 描述
[abc] 匹配 abc
[^abc] 匹配除 abc 以外的字符
[a-zA-Z] 匹配任意大小写英文字母
[a-d[m-p]] 匹配 a-dm-p 范围内的字符
[a-z&&[^bc]] 匹配 a-z 中除了 bc 的字符

代码示例:

java复制代码System.out.println("a".matches("[abc]")); // true
System.out.println("z".matches("[abc]")); // false
System.out.println("bc".matches("[abc][abc]")); // true

(2) 预定义字符类

预定义字符类是字符类的简化写法,用来匹配常见的字符类型

表达式 描述
. 匹配任意字符
\d 匹配数字,等价于 [0-9]
\D 匹配非数字,等价于 [^0-9]
\s 匹配空白字符
\S 匹配非空白字符
\w 匹配字母、数字、下划线,等价于 [a-zA-Z0-9_]
\W 匹配非字母、数字、下划线

代码示例:

java复制代码System.out.println("123".matches("\\d+")); // true
System.out.println("@".matches("\\w"));    // false
System.out.println("abc_123".matches("\\w+")); // true

(3) 数量词

数量词用来指定字符出现的次数

表达式 描述
X? 匹配 X 0 次或 1 次
X* 匹配 X 0 次或多次
X+ 匹配 X 1 次或多次
X{n} 匹配 X 恰好出现 n
X{n,} 匹配 X 至少出现 n
X{n,m} 匹配 X 至少出现 n 次但不超过 m

代码示例:

java复制代码System.out.println("123456789".matches("\\d{9}")); // true
System.out.println("123".matches("\\d{1,5}"));    // true

正则表达式实际应用

(1) 校验规则

校验QQ号

规则:6-20位数字,不能以 0 开头

java复制代码String qq = "12345678987";
System.out.println(qq.matches("[1-9]\\d{5,19}")); // true
校验手机号码

规则:以 1 开头,第二位是 3-9,后面跟 9 位数字

java复制代码String phone = "13933447894";
System.out.println(phone.matches("1[3-9]\\d{9}")); // true
校验邮箱地址

规则:用户名部分允许字母、数字、下划线,域名部分允许字母和数字,支持多级后缀

java复制代码String email = "gaomengsuanjia@163.com";
System.out.println(email.matches("\\w+([-+.']\\w+)*@[a-zA-Z0-9]+(\\.[a-zA-Z]{2,})+")); // true
校验座机号码

规则:开头以 0,后接 2-3 位区号,支持带或不带连字符

java复制代码String tel = "020-5698137";
System.out.println(tel.matches("0\\d{2,3}-?[1-9]\\d{4,9}")); // true

(2) 文本查找

利用 PatternMatcher 可以在大段文本中找到符合条件的子串

查找包含版本号的 Java 关键字
java复制代码String text = "java8和java11是长期支持版本,下一个是java17。";
Pattern pattern = Pattern.compile("java\\d{0,2}");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
    System.out.println(matcher.group());
}
// 输出:java8、java11、java17

通过以上代码示例和解释,我们了解了正则表达式的基本规则及在Java中的应用方式。正则表达式作为字符串处理的利器,可以极大提高开发效率。在实际项目中,我们可以利用正则表达式解决各种文本匹配和校验问题

最后,为了帮助大家复习正则表达式,可以玩一个小游戏
在这里插入图片描述