php 正则表达式匹配中文汉字

下面我们主要讲利用preg_match mb_eregi来验证汉字,并且正则过程出现问题的解决方法。

preg_match("/[a-z]{3,14}/",$content,[可选]$a);这个返回布尔值,$a得到的是数组,把匹配到的字符防在$a;

正则汉字

echo (mb_eregi("[x80-xff].","中d文") ? "有" : "无") ."汉字";

echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是汉字" : "");

看一判断全中文字符串函数

  1. $str = "请问php中的eregi如何匹配汉字";
  2. if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
  3. echo "这是一个纯中文字符串";
  4. } else{
  5. echo "这不是一个纯中文字串";
  6. }
  7. preg_match_all($pat,……)与preg_replace($pat,……)……
  8. preg_match_all("/(汉字)+/ism","我是汉字,看你把我怎么着!",$m_a);

各个编码的高位与低位的开始与结束,那么自然就可以写出正则,而且直接是十六位的,有啥困难?呵呵。不过要注意,在php里面,表示十六位是用的x。

所以如上,我们还可以用该正则表达式来判断是否是gb2312的汉字

  1. <?php
  2. $str = "小小子";
  3. if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
  4. print($str."确实全是汉字");
  5. } else {
  6. print($str."这个真tc不全是汉字");
  7. }
  8. ?>