正则表达式起源于1950年代在数学领域的一些研究工作。
正则表达式的主要用途之一是搜索变化多端的文本
什么是正则表达式
正则表达式是一些用来匹配和处理文本的字符串。
正则匹配任意字符
.字符可以匹配任何单个的字符、字母、数字甚至是,字符本身。
cs.xls
匹配特殊字符
.字符在正则表达式里有着特殊的含义。如果模式里需要一个.,就要想办法来告诉正则表达式你需要的是.字符本身而不是它在正则表达式里的特殊含义。为此,你必须在,的前面加上一个\(反斜杠)字符来对它进行转义。\是一个元字符
(metacharacter,表示”这个字符有特殊含义,而不是字符本身含义")。
a.\.xls
如果需要搜索\本身,就必须对\字符进行转义;相应的转义序列是两个连续的反斜杠字符\。
\\
匹配多个字符中的某一个
在正则表达式里,我们可以使用元字符[和]来定义一个字符集合。在使用[和]定义的字符集合里,这两个元字符之间的所有字符都是该集合的组成部分,字符集合的匹配结果是能够与该集合里的任意一个成员相匹配的文本。
被测试的问题
xx.xls
ord.xls
ord2.xls
s1.xls
b1.xls
c1.xls
o1drd.xls
规则
[sb].\.xls
结果
s1.xls
b1.xls