PHP中正则表达式详解(代码实例)
本文目标:
1、正则表达式的定义
2、正则表达式的几个基本语法
(一)、正则表达式的定义
正则表达式是对字符串进行操作的一种逻辑公式,就是用一些特定的字符组合成一个规则字符串。
比如:
- <?php
- $p = '/abc123/';
- $str = "abc123bbbb";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则';
- }
- ?>
上述代码中的'/abc123/'就是一个正则表达式,我们从中可以看出,/abc123/就是一串由字符和数字组成的字符串,只不过这些字符在里面有其特殊的含义,比如/abc123/这个正则表达式的规则是,字符串以abc123开头,任何字符串符合这个规则就它就和这个表达式相匹配了
(二)、正则表达式的几个基本语法
1、正则匹配模式使用分隔符与元字符组成,分隔符可以是非数字、非反斜线、非空格的任意字符。常见的分隔符比如正斜线(/)、hash符号(#) 以及取反符号(~)
举例如:
/hello world/ 表达式的意思是:字符串以hellow world开头
#^[0-9]$# 表达式的意思是:匹配0-9的数字
~hello~ 表达式的意思是:字符串包含hello
我们用代码来测试一下
例一、
/hello world/ 表达式的意思是:字符串以hellow world开头
- <?php
- $p = "/hello world/";
- $str = "hello world,i am a student";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则/hello world/<br/>';
- }
- ?>
运行结果如下:
该字符串符合这个规则/hello world/
换一个字符串看下,不以hello world开头
- <?php
- $p = "/hello world/";
- $str = "helloworld,i am a student";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则/hello world/<br/>';
- }
- ?>
运行结果为:
空白
例二、
#^[0-9]$# 表达式的意思是:匹配0-9的数字
- <?php
- $p2 = "#^[0-9]$#";
- $str2 = "3";
- if (preg_match($p2, $str2)) {
- echo '该字符串符合这个规则"#^[0-9]$#<br/>';
- }
- ?>
运行结果为:
该字符串符合这个规则"#^[0-9]$#
代码改一下,字符串改成一个大于9的数字看下
- <?php
- $p2 = "#^[0-9]$#";
- $str2 = "30";
- if (preg_match($p2, $str2)) {
- echo '该字符串符合这个规则"#^[0-9]$#<br/>';
- }else{
- echo '该字符串不符合这个规则"#^[0-9]$#<br/>';
- }
- ?>
运行结果为:
该字符串不符合这个规则"#^[0-9]$#
例三、
~hello~ 表达式的意思是:字符串包含hello
具体代码如下:
- <?php
- $p3 = "~hello~";
- $str3 = "ahellobb";
- if (preg_match($p3, $str3)) {
- echo '该字符串符合这个规则:~hello~';
- }else{
- echo '该字符串不符合这个规则:~hello~';
- }
- ?>
运行结果为:
该字符串符合这个规则:~hello~
现在把测试字符串改成不包含hellow
具体代码如下:
- <?php
- $p3 = "~hello~";
- $str3 = "hell o";
- if (preg_match($p3, $str3)) {
- echo '该字符串符合这个规则:~hello~';
- }else{
- echo '该字符串不符合这个规则:~hello~';
- }
- ?>
运行结果为:
该字符串不符合这个规则:~hello~
由此可见:
1、/表示开头
2、^表示以^后面的字符开始
3、$表示以$前面的字符结束
4、~表示包含的意思
2、如果模式中包含分隔符,则分隔符需要使用反斜杠(\)进行转义。
比如:
/https:\/\/www./ 表示以https://www.开头
具体代码如下:
- <?php
- $p = "/https:\/\/www./";
- $str = "https://www.baidu.com";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则:/https:\/\/www./';
- }else{
- echo '该字符串不符合这个规则:/https:\/\/www./';
- }
运行结果为:
该字符串符合这个规则:/https:\/\/www./
试着将字符串 改成不以https://www.开头看下
- <?php
- $p = "/https:\/\/www./";
- $str = "http://www.baidu.com";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则:/https:\/\/www./';
- }else{
- echo '该字符串不符合这个规则:/https:\/\/www./';
- }
运行结果为:
该字符串不符合这个规则:/https:\/\/www./
3、如果模式中包含较多的分割字符,建议更换其他的字符作为分隔符,也可以采用preg_quote进行转义。
例一、
- <?php
- $p = "/https://www.baidu.com/a/b/index.html/";
- $str = "http://www.baidu.com/a/b/index.html";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则:/https://www.baidu.com/a/b/index.html/';
- }else{
- echo '该字符串不符合这个规则:/https://www.baidu.com/a/b/index.html/';
- }
运行结果为:
Warning: preg_match(): Unknown modifier '/' in D:\E-class\class-code\classing\index.php on line 7
该字符串不符合这个规则:/https://www.baidu.com/a/b/index.html/
所以此时不能直接写/要么按照上面的进行转义,要么按照下面的方式进行
具体代码如下:
- <?php
- $p = "https://www.baidu.com/a/b/index.html";
- $p = '/'.preg_quote($p, '/').'/';
- $str = "https://www.baidu.com/a/b/index.html";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则:/https://www.baidu.com/a/b/index.html/';
- }else{
- echo '该字符串不符合这个规则:/https://www.baidu.com/a/b/index.html/';
- }
- ?>
运行结果为:
该字符串符合这个规则:/https://www.baidu.com/a/b/index.html/
4、分隔符后面可以使用模式修饰符,模式修饰符包括:i,m, s,等
总结:
1、i 表示可以忽略大小写
2、m表示多行匹配
3、如果设定了此修正符,模式中的圆点元字符(.)匹配所有的字符,包括换行符。没有此设定的话,则不包括换行符。
案例一、
实践目标:
1、i 表示可以忽略大小写
- <?php
- $p = "/ABc/i";
- $str = "abc";
- if (preg_match($p, $str)) {
- echo '该字符串符合这个规则:/ABc/i';
- }else{
- echo '该字符串不符合这个规则:/ABc/i';
- }
- ?>
该字符串符合这个规则:/ABc/i
案例二、
实践目标:
1、m表示多行匹配
具体代码如下:
- <?php
- $p = "/chinese/m";
- $str = "i am a chinese people,\n you alose is a chinese people";
- $math = "";
- if (preg_match_all($p, $str,$math)) {
- echo '该字符串符合这个规则:/chinese/m,匹配结果为:';
- print_r($math);
- }else{
- echo '该字符串不符合这个规则:/chinese/m';
- }
- ?>
运行结果为:
该字符串符合这个规则:/chinese/m,匹配结果为:Array ( [0] => Array ( [0] => chinese [1] => chinese ) )
这里要注意的是一定要用preg_match_all否则用preg_match它只会匹配一行
接下来我们运行下效果
- <?php
- $p = "/chinese/m";
- $str = "i am a chinese people,\n you alose is a chinese people";
- $math = "";
- if (preg_match($p, $str,$math)) {
- echo '该字符串符合这个规则:/chinese/m,匹配结果为:';
- print_r($math);
- }else{
- echo '该字符串不符合这个规则:/chinese/m';
- }
- ?>
运行结果为:
该字符串符合这个规则:/chinese/m,匹配结果为:Array ( [0] => chinese )
其实/m在此也算多此一举,因为preg_match_all就是表示多行匹配了
- <?php
- $p = "/chinese/";
- $str = "i am a chinese people,\n you alose is a chinese people";
- $math = "";
- if (preg_match_all($p, $str,$math)) {
- echo '该字符串符合这个规则,匹配结果为:';
- print_r($math);
- }else{
- echo '该字符串不符合这个规则';
- }
- ?>
运行结果其实是一样的,结果为:
该字符串符合这个规则,匹配结果为:Array ( [0] => Array ( [0] => chinese [1] => chinese ) )
只是要知道m表示多行匹配的意思
案例三、
实践目标:
1、如果设定了此修正符,模式中的圆点元字符(.)匹配所有的字符,包括换行符。没有此设定的话,则不包括换行符。
具体代码如下:
- <?php
- $p = "/chinese ./s";
- $str = "i am a chinese \n people, you alose is a chinese good people";
- $math = "";
- if (preg_match_all($p, $str,$math)) {
- echo '该字符串符合这个规则,匹配结果为:';
- print_r($math);
- }else{
- echo '该字符串不符合这个规则';
- }
- ?>
运行结果如下:
该字符串符合这个规则,匹配结果为:Array ( [0] => Array ( [0] => chinese [1] => chinese g ) )
说明第一个chinese 后面的字符是换行也匹配到了,这说明了s的意思就是.要包含换行符,接下来
我们去掉s,看下最终的结果
- <?php
- $p = "/chinese ./";
- $str = "i am a chinese \n people, you alose is a chinese good people";
- $math = "";
- if (preg_match_all($p, $str,$math)) {
- echo '该字符串符合这个规则,匹配结果为:';
- print_r($math);
- }else{
- echo '该字符串不符合这个规则';
- }
- ?>
运行结果如下:
该字符串符合这个规则,匹配结果为:Array ( [0] => Array ( [0] => chinese g ) )
说明此刻只匹配到一个了,因为.不包含换行符,所以第一个chinese没有匹配到
总结:
本文主要讲解了
1、正则表达式的定义
2、正则表达式的几个基本语法