php正则表达式匹配中文

2023-07-21 21:31•正则表达式•阅读 589

在php中要利用正则来匹配中文汉字的话我们需要了解字符串编码然后还有汉字的内码这样才可以方便快速的实现精确的匹配中文汉字出来，在php中来判断字符串是否为中文，就会沿袭这个思路,代码如下:

<?php
$str = "php编程";
if (preg_match("/^[u4e00-u9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
?>

不过,很快就会发现,php并不支持这样的表达,报错：

Warning: preg_match() [function.preg-match]: Compilation failed: PCRE does not support L, l, N, U,or u at offset 3 in test.php on line 3

刚开始从google上查了很多次,想从php正则表达式对于十六进制数据的表达方式上进行突破,发现在php中,是用x表示十六进制数据的,于是，变换成如下的代码：

$str = "php编程";
if (preg_match("/^[x4e00-x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。

如果要精准匹配中文,即匹配纯中文字符,或匹配中文字符加上全角标点,则需要根据不同编码环境使用不同方法。

下面以两种常用的编码(gb2312,utf-8)代码如下:

//ANSI编程环境下:
$strtest = “yyg中文字符yyg”;
$pregstr = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";
if(preg_match($pregstr,$strtest,$matchArray)){
echo $matchArray[0];
}
//output:中文字符

//Utf-8编程环境下:
$strtest = “yyg中文字符yyg”;
$pregstr = "/[x{4e00}-x{9fa5}]+/u";
if(preg_match($pregstr,$strtest,$matchArray)){
echo $matchArray[0];
}
//output:中文字符

赞 (6)

PHP常用的正则表达式

上一篇5-18

PHP正则匹配中文字母数字正则表达式

下一篇 4-27

PHP一些常用的正则表达式集锦
PHP一些常用的正则表达式集锦匹配中文字符的正则表达式：[\u4e00-\u9fa5]匹配双字节字符(包括汉字在内)：["\x00-\xff]应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）String.prototyp…
•正则表达式
2016-06-0215837
常用的php正则表达式及语法注解
常用的php正则表达式及语法注解常用的php正则表达式及语法注解:匹配中文字符的正则表达式：[\u4e00-\u9fa5]注解：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]注解：可…
•正则表达式
2016-06-108888
PHP正则匹配中文字母数字正则表达式
在php中匹配数字与字母很简单,但是匹配中文汉字时就会出现一些问题了,下面我来给大家介绍在php中匹配中文,数字,字母的一些方法。方法一,代码如下:if(preg_match("/^d*$/","4312")){echo"全数字";}if(preg_match("/^[a-z]*$/i","fdsFDfd")){echo"全字母";}if(preg_match("/^[a-zd]*$/i","fd…
•正则表达式
2023-06-101084
正则表达式
PHP正则表达式之2种模式和Cookie详解（代码实例）
本文目标：1、了解正则表达式的贪婪模式的定义2、了解正则表达式的懒惰模式的定义3、掌握正则表达式的贪婪模式的用法4、掌握正则表达式的懒惰模式的用法5、了解PHP中Cookie的定义6、掌握Cookie的基本用法，获取和设置（一）、了解正则表达式的贪婪模式的定义贪婪模式的定义：在可匹配与可不匹配的时候，优先匹配（二）、了解正则表达式的懒惰模式的定义懒惰模式的定义：和贪婪模式相反，在可匹配与可不匹配的…
2023-07-19693
PHP常用正则表达式精选（推荐）
这篇文章主要介绍了PHP常用正则表达式，非常不错，具有一定的参考借鉴价值,需要的朋友可以参考下。PHP常用正则表达式，具体内容如下所述：$regex='[\u4e00-\u9fa5]';//匹配中文字符的正则表达式$regex='^[\u4E00-\u9FA5A-Za-z0-9]+$';or$regex='^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$';//中文、英文、数字但不…
•正则表达式
2023-07-19651
浅谈php正则表达式中的非贪婪模式匹配的使用
这里通过实例简单介绍了下php正则表达式中的非贪婪模式匹配的使用方法，有需要的小伙伴们参考下吧。通常我们会这么写：$str="http://www.baidu/.com?url=www.sina.com/";preg_match("/http:(.*)com/",$str,$matches);print_r($matches);结果：Array([0]=>http://www.baidu/.…
•正则表达式
2023-07-19584
php用正则表达式匹配中文实例详解
在php中汉字正则可能有些朋友觉得很简单，但是在使用时会发现在gbk编码与uft8编码可能会有点区别哦，下面小编来介绍一下。gbk编码下汉字正则1.判断字符串是否全是汉字,代码如下:<?php$str='全部是汉字测试';if(preg_match_all("/^([x81-xfe][x40-xfe])+$/",$str,$match)){echo'全部是汉字';}else{echo'不全是…
•正则表达式
2023-07-19681
php正则表达式匹配html过滤非法字符
匹配一个html标签，匹配table如下:<table.*?>[ss]*</table>或:<table.*?>[ss]*?</table>,以上两个表达式,一个加了"?"和一个却不加"?"，那么这有什么区别呢？我们知道"?"在正则表达式里是一个通配符:匹配前面的子表达式零次或一次,或指明一个非贪婪限定符.在这里,通过测试,我们得出这样的结论:在不加…
•正则表达式
2023-07-20642