php 检测字符编码代码

2023-07-17 15:32•php函数•阅读 735

function utf8_gb2312($str, $default = 'gb2312')
{
$str = preg_replace("/[x01-x7f]+/", "", $str);
if (emptyempty($str)) return $default;
$preg = array(
"gb2312" => "/^([xa1-xf7][xa0-xfe])+$/", //正则判断是否是gb2312
"utf-8" => "/^[x{4e00}-x{9fa5}]+$/u", //正则判断是否是汉字(utf8编码的条件了)，这个范围实际上已经包含了繁体中文字了
);
if ($default == 'gb2312') {
$option = 'utf-8';
} else {
$option = 'gb2312';
}
if (!preg_match($preg[$default], $str)) {
return $option;
}
$str = @iconv($default, $option, $str);
//不能转成 $option, 说明原来的不是 $default
if (emptyempty($str)) {
return $option;
}

默认编码是gb2312，而且我统计了一下，90%的情况下都是gb2312，所以，我的检测函数不能出现本来是gb2312的，结果被检测出utf8. 基本思路是：

1. 把所有的ascii去掉，如果全部都是ascii，那么就是gb2312。

2. 假设这个字符串是gb2312，用一个正则检查它是否是真的gb2312，如果不是，那么就是utf-8

3. 然后，用iconv 把字符串转换成utf8，如果转换不成功，那么原来可能不是真正的一个gb2312编码的字符（用正则匹配我已经尽量精确，但是，gb2312的编码不是连续的，还是会有空洞），那么最后的编码就是utf-8.

4. 否则就是gb2312 编码：加入这样的检查功能后，在1000个关键字里面，就出现了1个乱码，比以前的近100个关键字乱码少了很多。

赞 (1)

php实现文件编码批量转换

上一篇3-12

支持中文和其他编码的php截取字符串函数分享

下一篇 7-1

php检测文件编码的方法
php检测文件编码的方法关于文件编码的检测，百度一下一大把都是，但是确实没有能用的、很多人建议mb_detect_encoding检测，可是不知为何我这不成功，什么都没输出、看到有人写了个增强版，用BOM判断的，我果断就无视了，这东西完全不…
•php文件操作
2016-02-1917323
PHP错误处理
PHP错误处理PHP错误处理在创建脚本和web应用程序时，错误处理是一个重要的部分。如果您的代码缺少错误检测编码，那么程序看上去很不专业，也为安全风险敞开了大门。本教程介绍了PHP中一些最为重要的错误检测方法。我们将为您讲解不同的错误处理方…
•php高级应用
2016-09-0213722
php 检测是否为utf-8还是gb2312编码
在php中检测字符串编码的方法有很多,最常用的就是直接使用mb_detect_encoding函数了,但还有更高级的办法就是使用字符的ascii值来判断.例1代码如下:functionis_utf8($str){$c=0;$b=0;$bits=0;$len=strlen($str);for($i=0;$i<$len;$i++){$c=ord($str[$i]);if($c>128){i…
•php函数
2023-06-06910
PHP错误处理函数
在PHP中，默认的错误处理很简单。一条错误消息会被发送到浏览器，这条消息带有文件名、行号以及描述错误的消息。PHP错误处理在创建脚本和Web应用程序时，错误处理是一个重要的部分。如果您的代码缺少错误检测编码，那么程序看上去很不专业，也为安全风险敞开了大门。本教程介绍了PHP中一些最为重要的错误检测方法。我们将为您讲解不同的错误处理方法：简单的"die()"语句自定义错误和错误触发器错误报告基本的错…
•php函数
2023-06-29622
完美的2个php检测字符串是否是utf-8编码函数分享
这篇文章主要介绍了完美的2个php检测字符串是否是utf-8编码函数分享,一个比较强大、一个比较简洁,需要的朋友可以参考下在php开发中有时候会用到转码函数，比如iconv(),mb_convert_encoding()函数，在用函数转码的时候或者解码的时候我们有时候需要先判断当前字符串编码类型，不如是否是utf-8编码，是的话然后进行编码转换等操作。下面是小编整理的目前web开发中网上使用率比较…
•php函数
2023-07-04545
自己写了一个php检测文件编码的函数
关于文件编码的检测，百度一下一大把都是，但是确实没有能用的，下面是自己写了一个检测函数，希望对大家有所帮助。关于文件编码的检测，百度一下一大把都是，但是确实没有能用的、很多人建议mb_detect_encoding检测，可是不知为何我这不成功，什么都没输出、看到有人写了个增强版，用BOM判断的，我果断就无视了，这东西完全不靠谱、最终根据PHP手册里mb_detect_encoding函数下方的例子…
•php函数
2023-07-04501
支持中文和其他编码的php截取字符串函数分享(截取中文字符串)
这篇文章主要介绍了支持中文和其他编码的php截取字符串函数示例(截取中文字符串),需要的朋友可以参考下。简单的字符串截取方法，支持中文和其他编码，传入相对应的参数直接调用就可以了，代码如下:/***字符串截取，支持中文和其他编码*@static*@accesspublic*@paramstring$str需要转换的字符串*@paramstring$start开始位置*@paramstring$le…
•php函数
2023-07-04585
PHP如何使用urlencode()函数进行url编码？（代码示例）
urlencode()函数是PHP中的一个内置函数，用于对url进行编码。下面本篇文章就来给大家介绍一些urlencode()函数的用法，让大家了解urlencode()函数是如何对url进行编码的，希望对大家有所帮助。urlencode()函数接受一个url为参数，返回一个字符串。该字符串中包含的除了-_.之外的所有非字母数字字符，都将用百分号（％）后跟两个十六进制数字来替换，空格则被编码为加号…
•php函数
2023-07-05445