PHP中文地址栏url编解码 urlencode()与rawurlencode()函数

string urlencode ( string str)

有一点需要注意的地方是,urldecode() 和 rawurldecode() 解码出的字符串是 utf-8格式的编码,如果url中含有中文的话,而页面设置又不是 utf-8 的话,则要把解码出的字符串进行转换,才能正常显示.

还有一个问题,就是所获得的 url 不是 %%nn n={0..f} 的格式,而是 %unnnn n={0..f} 的格式,这时候再使用 urldecode() 和 rawurldecode() 是无法正确解码的,而要用下面这个函数才能正确解码,代码如下:

  1. function utf8rawurldecode ($source)
  2. {
  3. $decodedstr = "";
  4. $pos = 0;
  5. $len = strlen ($source);
  6. while ($pos < $len) {
  7. $charat = substr ($source, $pos, 1);
  8. if ($charat == '%') {
  9. $pos++;
  10. $charat = substr ($source, $pos, 1);
  11. if ($charat == 'u') {
  12. // we got a unicode character
  13. $pos++;
  14. $unicodehexval = substr ($source, $pos, 4);
  15. $unicode = hexdec ($unicodehexval);
  16. $entity = "&#". $unicode . ';';
  17. $decodedstr .= utf8_encode ($entity);
  18. $pos += 4;
  19. }
  20. else {
  21. // we have an escaped ascii character
  22. $hexval = substr ($source, $pos, 2);
  23. $decodedstr .= chr (hexdec ($hexval));
  24. $pos += 2;
  25. }
  26. } else {
  27. $decodedstr .= $charat;
  28. $pos++;
  29. } //开源代码phpfensi.com
  30. }
  31. return $decodedstr;
  32. }

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+),此编码与 www 表单 post 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 rfc1738 编码(参见 rawurlencode())不同。此函数便于将字符串编码并将其用于 url 的请求部分,同时它还便于将变量传递给下一页,例子 1. urlencode() 示例,代码如下:

  1. <?php
  2. echo '<a href="mycgi?foo=', urlencode($userinput), '">';
  3. ?>

注意:小心与 html 实体相匹配的变量,像 &、© 和 £ 都将被浏览器解析,并使用实际实体替代所期待的变量名。这是明显的混乱,w3c 已经告诫人们好几年了,参考地址:http://www.w3.org/tr/html4/appendix/notes.html#h-b.2.2 php 通过 arg_separator .ini 指令,支持将参数分割符变成 w3c 所建议的分号。不幸的是大多数用户代理并不发送分号分隔符格式的表单数据。较为简单的解决办法是使用 & 代替 & 作为分隔符。你不需要为此修改 php 的 arg_separator。让它仍为 &,而仅使用 htmlentities(urlencode($data)) 对你的 url 进行编码。

例子 2. urlencode() 与 htmlentities() 示例,代码如下:

  1. <?php
  2. echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">';
  3. ?>

string urlencode ( string str)

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,这是在 rfc 1738 中描述的编码,是为了保护原义字符以免其被解释为特殊的 url 定界符,同时保护 url 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱,例如,如果你想在 ftp 的 url 中包含密码.

例子 1. rawurlencode() 示例 1,代码如下:

  1. <?php
  2. echo '<a href="ftp://user:', rawurlencode('foo @+%/'),
  3. '@ftp.my.com/x.txt">';
  4. ?>

或者,如果你想通过 url 的 path_info 构成部分去传递信息.

例子 2. rawurlencode(),代码如下:

  1. <?php
  2. echo '<a href="http://x.com/department_list_script/',
  3. rawurlencode('sales and marketing/miami'), '">';
  4. ?>

在解码时,可以使用相应的 urldecode() 和 rawurldecode(),相应地,rawurldecode() 不会把加号('+')解码为空格,而 urldecode() 可以,下面是详细示例.

string urldecode ( string str)

解码给出的已编码字符串中的任何 %##。返回解码后的字符串.

例子 1. urldecode() example,代码如下:

  1. <?php
  2. $a = explode('&', $query_string);
  3. $i = 0;
  4. while ($i < count($a)) {
  5. $b = split('=', $a[$i]);
  6. echo 'value for parameter ', htmlspecialchars(urldecode($b[0])),
  7. ' is ', htmlspecialchars(urldecode($b[1])), "<br />n";
  8. $i++;
  9. }
  10. ?>

string rawurldecode ( string str)

返回字符串,此字符串中百分号(%)后跟两位十六进制数的序列都将被替换成原义字符.

例子 1. rawurldecode() 示例,代码如下:

  1. <?php
  2. echo rawurldecode('foo%20bar%40baz'); // foo bar@baz
  3. ?>