php字符串与中文字符拆分方法

直接用php函数“str_split”来分割,会出现乱码,因为中文字符长度和英文字符长度是不一样的,但是我们可以建立新的函数先把字符转成ascii值,接着通过判断不同字符的长度来正确分割中文字符串,把结果存入数组,最后再用php函数“join”在字符间插入百分号.

方法一,实例代码如下:

  1. <?php
  2. function str_split_utf8($str){
  3. $split=1;
  4. $array=array();
  5. for($i=0;$i<strlen($str)){
  6. $value=ord($str[$i]);
  7. if($value>127){
  8. if($value>=192&&$value<=223) $split=2;
  9. elseif($value>=224 && $value<=239) $split=3;
  10. elseif($value>=240 && $value<=247) $split=4;
  11. }else{
  12. $split=1;
  13. }
  14. $key=null;
  15. for($j=0;$j<$split;$j++,$i++){
  16. $key.=$str[$i];
  17. }
  18. array_push($array,$key);
  19. }
  20. return $array;
  21. }
  22. $string="php粉丝网www.phpfensi.com";
  23. $arr1=str_split_utf8($string);
  24. echo join("%",$arr1);
  25. ?>

方法二,实例代码如下:

  1. <?php
  2. $str="php粉丝网:http://www.phpfensi.com";
  3. function mbstringtoarray($str,$charset) {
  4. $strlen=mb_strlen($str);
  5. while($strlen){
  6. $array[]=mb_substr($str,0,1,$charset);
  7. $str=mb_substr($str,1,$strlen,$charset);
  8. $strlen=mb_strlen($str);
  9. }
  10. return $array;
  11. }
  12. $arr=mbstringtoarray($str,"gb2312");
  13. ?>

注意:

1、$charset变量为网页编码,如"gb2312"或"utf-8";

2、使用方法一要求服务器必须开启mbstring.dll扩展,否则代码执行错误,所以对于使用虚拟主机的朋友,可以考虑使用下面的这种方法.

方法三,实例代码如下:

  1. <?php
  2. function str_to_arr($str){
  3. $l=strlen($str);
  4. for($i=0;$i<$l;$i++){
  5. $arr[]=ord($str[$i])>127?$str[$i].$str[++$i]:$str[$i];
  6. }
  7. return $arr;
  8. }
  9. $arr=str_to_arr($str);
  10. ?>