根据正则表达式语法规则,正则表达式的匹配模式是由一系列的字符构成的。
一.普通字符:
大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字。
也就是说普通字符只能够匹配字符串中与它们相同的字符。
二.元字符:
由于普通字符只能匹配与自身相同的字符,那么正则表达式的灵活性和强大的匹配功能就不能完全展现,于是正则表达式中规定了一系列的特殊字符,这些字符不是按照字符的直接量进行匹配的,而是具有特殊的语义,
例如下面如下字符:
^ $ . * + ? = ! : | \ / ( ) [ ] { }
虽然说上面的字符具有特殊含义,但是一些字符只有在某些上下文环境中才具有特殊的含义。
如果要匹配这些具有特殊含义的字符直接量,需要在这些字符前面加反斜杠(\)转义,例如我想匹配一个$直接量,需要写成\$,否则就是匹配一个结尾位置。正是由于这些特殊字符的存在,才会是正则表达式具有强大的功能。
由于它们是构造各种匹配复杂文本的正则表达式的基本字符,所以被称作元字符。
原文地址是正则表达式 元字符和普通字符一章节。