PHP正则匹配字符串中的中文

2023-07-20 15:14•正则表达式•阅读 397

我们先要明白,中文双字节字符编码范围:

1. GBK (GB2312/GB18030)

x00-xff GBK双字节编码范围

x20-x7f ASCII,xa1-xff 中文 gb2312,x80-xff 中文 gbk

2. UTF-8 (Unicode)

u4e00-u9fa5 (中文),x3130-x318F (韩文),xAC00-xD7A3 (韩文),u0800-u4e00 (日文)

获取指定的中文与字符,例1,代码如下:

<?php
$str = '正则如何匹配中文字在某中文字符串中？';
preg_match("/中/",$str,$regs);
print_r($regs);
?>//开源代码phpfensi.com
//输出
Array
(
[0] => 中
)

例2,代码如下:

<?php
$str = '这里是中文 this is English';
//把中文变成红色
echo preg_replace("/([x80-xff].)/","<font color=red>\1</font>",$str);
//把非中文变成红色
echo preg_replace("/([x20-x7f])/","<font color=red>\1</font>",$str);
?>

里面有中文、英文、数字等混排,则需要对汉字进行特殊处理,由于PCRE不支持U P L之类的perl字符串处理转义,使用16进制或者Unicode进行处理,范例如下:

$str = "之二宽阔的甘家口东#标签1#标签2 #标签3。#标签4,都发$1234 ￥xc,cvm , ￥12,dflksjf如何#标签5.x #tag6.cvxcv“";
preg_match_all('/#([a-zA-Z0-9x7f-xff]+)/', $str, $mat);
print_r($mat);
//开源代码phpfensi.com
preg_match("/[x{00a5}x{ffe5}](d+)/u", $str, $mat);
print_r($mat);

最后我明白了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[x{4e00}-x{9fa5}]+$/u,代码如下:

$str = "php编程";
if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

实例:下面这款匹配中文字符串正则表达式是一款利用数组,然后多次for把全是中文字符串的打印出来.

*/
$str_arr = array(
"iameverysorry",
"快乐编程，快乐生活",
"php教程编程",
"1997年香港回归",
"英语学习abc",
"www.phpfensi.com"
);
$patt_ch = chr(0xa1) . "-" . chr(0xff);
foreach ($str_arr as $str)
{
echo "字符串'$str' 是";
if (preg_match("/^[$patt_ch]+$/", $str))
{
echo "<b>完全中文</b>";
echo "<br>";
echo "<br>";
}
else
{
echo "非完全中文";
echo "<br>";
echo "<br>";
}
}

赞 (13)

PHP正则表达式的使用技巧

上一篇10-6

PHP如何判断字符串中的中文字符

下一篇 3-16

PHP常用的正则表达式
PHP常用的正则表达式正则表达式用于字符串处理、表单验证等场合，实用高效。本文收集了一些常用的表达式：匹配中文字符的正则表达式：[“u4e00-“u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内…
•正则表达式
2015-05-1814535
PHP正则表达式中的特殊字符
PHP正则表达式中的特殊字符字符/意义：对于字符，通常表示按字面意义，指出接着的字符为特殊字符，不作解释。例如：/b/匹配字符’b’，通过在b前面加一个反斜杠，也就是/b/，则该字符变成特殊字符，表示匹配一个单词的分界线。或者：对于几个字符…
•正则表达式
2015-05-246894
PHP正则表达式:PHP中的正则函数
PHP正则表达式:PHP中的正则函数PHP正则表达式主要用于字符串的模式分割、匹配、查找及替换操作。使用正则表达式在某些简单的环境下可能效率不高，因此如何更好的使用PHP正则表达式需要综合考虑。我的PHP正则入门，是起源于网上的一篇文章，这…
•正则表达式
2015-06-2211110
PHP一些常用的正则表达式集锦
PHP一些常用的正则表达式集锦匹配中文字符的正则表达式：[\u4e00-\u9fa5]匹配双字节字符(包括汉字在内)：["\x00-\xff]应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）String.prototyp…
•正则表达式
2016-06-0215772
用php正则表达式去掉字符串的所有空白
用php正则表达式去掉字符串的所有空白在php中如果想要去掉字符串开始和结束的空白可以使用PHP内部函数trim()函数。但是我们经常想去掉字符窜中的所有空白。需要把开始和结束的空白清除掉，将多个空白变为一个空白，使用正则表达式来处理同样的…
•正则表达式
2016-07-108080
PHP中的正则函数
PHP中的正则函数PHP正则表达式主要用于字符串的模式分割、匹配、查找及替换操作。使用正则表达式在某些简单的环境下可能效率不高，因此如何更好的使用PHP正则表达式需要综合考虑。我的PHP正则入门，是起源于网上的一篇文章，这篇文章由浅入深的阐…
•正则表达式
2016-08-0516454
使用Perl常规表达式进行匹配
长期以来，Perl以其对常规表达式的固有支持，一直是非常流行的文本处理工具。在这篇入门性文章中，我们将带领你简单了解如何在你自己的程序中使用常规表达式，实现更加强大的文本搜索和替代功能。我们首先了解最简单的常规表达式：匹配。假如在字符串中找到相匹配的模式，匹配操作就返回真值。因此下面的表达式：$string=~m/text/只有在变量“$string”中的字符串包含子字符串“text”时才返回真值…
•正则表达式
2023-06-10686
PHP正则匹配中文字母数字正则表达式
在php中匹配数字与字母很简单,但是匹配中文汉字时就会出现一些问题了,下面我来给大家介绍在php中匹配中文,数字,字母的一些方法。方法一,代码如下:if(preg_match("/^d*$/","4312")){echo"全数字";}if(preg_match("/^[a-z]*$/i","fdsFDfd")){echo"全字母";}if(preg_match("/^[a-zd]*$/i","fd…
•正则表达式
2023-06-10991