php截取字符串之截取utf8或gbk编码的中英文字符串示例

2015-02-14 12:41•php数组•阅读 7502

php截取字符串之截取utf8或gbk编码的中英文字符串示例

php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求,下面给大家提供一个方法来完成这样的功能

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。

php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。

mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。

google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$charset 只支持gbk与utf-8。

代码如下:

$a = "s＠@你好";

var_dump(strlen_weibo($a,'utf-8'));

结果输出为8，其中字母s计数为1，全角＠计数为2，半角@计数为1，两个中文计数为4。源码如下：

代码如下:

function strlen_weibo($string, $charset='utf-8')

{

$n = $count = 0;

$length = strlen($string);

if (strtolower($charset) == 'utf-8')

{

while ($n < $length)

{

$currentByte = ord($string[$n]);

if ($currentByte == 9 ||

$currentByte == 10 ||

(32 <= $currentByte && $currentByte <= 126))

{

$n++;

$count++;

} elseif (194 <= $currentByte && $currentByte <= 223)

{

$n += 2;

$count += 2;

} elseif (224 <= $currentByte && $currentByte <= 239)

{

$n += 3;

$count += 2;

} elseif (240 <= $currentByte && $currentByte <= 247)

{

$n += 4;

$count += 2;

} elseif (248 <= $currentByte && $currentByte <= 251)

{

$n += 5;

$count += 2;

} elseif ($currentByte == 252 || $currentByte == 253)

{

$n += 6;

$count += 2;

} else

{

$n++;

$count++;

}

if ($count >= $length)

{

break;

}

}

return $count;

} else

{

for ($i = 0; $i < $length; $i++)

{

if (ord($string[$i]) > 127)

{

$i++;

$count++;

}

$count++;

}

return $count;

}

}

赞 (0)

PHP对GBK和UTF8编码的处理

上一篇12-16

php实现文件编码批量转换

下一篇 3-12

PHP如何判断字符串中的中文字符
PHP如何判断字符串中的中文字符PHP判断中英文的依据是字符的ASII值，而字符的ASII值也因编码不同而不同。为了能编写判断中英文字符的php程序，我们必须先来了解下各编码下中文英文字符的ASII值范围：1.GBK(GB2312/GB18…
•php数组
2015-03-1617586
支持中文和其他编码的php截取字符串函数分享
支持中文和其他编码的php截取字符串函数分享这篇文章主要介绍了支持中文和其他编码的php截取字符串函数示例(截取中文字符串),需要的朋友可以参考下简单的字符串截取方法，支持中文和其他编码，传入相对应的参数直接调用就可以了代码如下:/***字…
•php函数
2015-07-0117641
PHP中字符串替换时导致的乱码
PHP中字符串替换时导致的乱码文件chinese.php本身是utf8编码。chinese.php<?phpdefine('l',"<br/>\n");$f=$_REQUEST['f'];function_exists($…
•php环境搭建
2015-09-1112381
php字符串截取的简单方法
php字符串截取的简单方法这篇文章介绍了php字符串截取的简单方法，有需要的朋友可以参考一下复制代码代码如下:strpos(string,find,start)实例：复制代码代码如下:<?phpechostrpos("Hellowor…
•php数组
2015-10-1214538
php截取中文字符串不乱码的方法
php截取中文字符串不乱码的方法利用php内置方法mb_substr截取中文不乱码，使用起来非常简单，大家参考使用吧GBK编码截取示例代码如下:$str='我是谁';//gbk编码的字符串echomb_substr($str,0,1,'gb…
•php日期
2015-11-2513555
php 判断网页是否是utf8编码的方法
php判断网页是否是utf8编码的方法//判断编码.代码如下:$encode=mb_detect_encoding($q,array('GB2312','GBK','UTF-8'));echo$encode."";if($encode=="…
•php分页
2016-04-2012727
PHP截取中文字符串的问题
PHP截取中文字符串的问题以下代码试用于GB2312编码，截取中文字符串是PHP中一个头疼的问题，解决方法是根据值是否大于等于128来判断是否是双字节字符，以避免出现乱码的情况。但中英文混合、特殊符号等问题总是存在，现在写一个比较全面的，仅…
•php函数
2016-05-3017932
基于php导出到Excel或CSV的详解(附utf8、gbk 编码转换)
基于php导出到Excel或CSV的详解(附utf8、gbk编码转换)php导入到excel乱码是因为utf8编码在xp系统不支持所有utf8编码转码一下就完美解决了utf-8编码案例Php代码复制代码代码如下:<?phpheader…
•Php 与 Smarty
2016-09-0419332