正则表达式字符意义:
.
符合任一字符
/d
符合0~9任一个数字字符
/D
符合0~9以外的字符
/s
符合/t、/n、/x0B、/f、/r等空格符
/w
符合a~z、A~Z、0~9等字符,也就是数字或是字母都符合
/W
符合a~z、A~Z、0~9等之外的字符,也就是除数字与字母外都符合
举例来说,如果有一字符串abcdebcadxbc,若使用.bc来作比对,符合的子字符串有abc、ebc、xbc 3个;如果使用..cd,则符合的子字符串只有abcd。
字符类范例
[abc]
符合a、b或c
[^abc]
符合a或b或c之外的字符
[a-zA-Z]
符合a~z或者是A~Z的字符
[a-d[m-p]]
a~d或者是m~p,也可以写成[a-dm-p]
[a-z&&[def]]
a~z并且是d或e或f,结果就是d或e或f可以符合
[a-z&&[^bc]]
a~z并且不是b或c
[a-z&&[^m-p]]
a~z并且不是m~p
指定一个字符之外,也可以加上“贪婪量词”(Greedy Quantifiers)来指定字符可能出现的次数。
贪婪量词范例
X?
X可出现一次或完全没有
X*
X可出现零次或多次
X+
X可出现一次或多次
X{n}
X可出现n次
X{n,}
X可出现至少n次
X{n, m}
X可出现至少n次,但不超过m次
另外,还有Reluctant quantifiers、Possessive quantifiers等的指定,可以自行参考java.util.regex.Pattern类API文件中的说明。
Java在J2SE 1.4之后开始支持正则表达式,您可以在API文件的java.util.regex.Pattern类中找到支持的正则表达式相关信息,可以将正则表达式应用于字符串的比对、取代、分离等动作上
分割实例:
String IPString = "(.+)(分类号:.+ )*";//符合条件的正则表达式
if (IPS.matches(IPString)) {
int start = IPS.indexOf("分类号:");
int last = IPS.lastIndexOf(" ");
s = IPS.substring(start + 4, last);
}