探索PHP 生命周期

PHP的生命周期是一个很复杂的过程,其生命周期应该被热衷于使用它的人所掌握,主要内容如下:

PHP 启动。如果运行的是 CLI 或者 FPM,它将运行 C main()。如果作为模块运行到网络服务器,像使用 apxs2 SAPI (Apache 2),则 PHP 在 Apache 启动后不久启动,并开始运行其模块的启动序列,PHP 就是其中之一。在内部称启动为模块启动步骤。我们也将其缩写为MINIT步骤。

一旦启动,PHP 将等待处理一个/几个请求。当我们谈论 PHP CLI时,将只有一个请求:当前脚本要运行。但是,当我们谈论 Web 环境时——应该是 PHP-FPM 或 Web 服务器模块——PHP 可以一个接一个地处理多个请求。这完全依赖于你如何配置你的 Web 服务器:你可以告诉它处理无限数量的请求,或在关闭并回收该过程之前处理特定数量的请求。每次一个新的请求在线程中要处理时,PHP 就会运行请求启动步骤。我们称之为 RINIT。

请求得到处理,(可能)生成了一些内容,OK。是时候关闭请求,并准备好处理另一个请求。关闭请求调用请求关闭步骤。我们称之为RSHUTDOWN。·

当处理完X个请求(一个,几十个,数千个等),PHP 最后会自行关闭,然后结束。关闭 PHP 进程称为模块关闭步骤。缩写为 MSHUTDOWN。

如果我们可以画出这些步骤,则可能会得到以下信息:

探索PHP 生命周期

并行模型

在 CLI 环境,任何事都很容易:一个进程处理一个请求:它会启动一个单独的 PHP 脚本,然后结束。CLI 环境是 Web 环境的一种特殊化,它更为复杂。

为了同时处理多个请求,你必须运行并行模型。在 PHP 中存在两种:

The process-based model 基于进程的模型

The thread-based model 基于线程的模型

使用基于进程的模型,操作系统将每个 PHP 解释器隔离到自己的进程中。这种模型在 Unix 非常普遍。每个请求都到它自己的进程。PHP-CLI、PHP-FPM 和 PHP-CGI 使用该模型。

在基于线程的模型中,每个 PHP 解释器都使用线程库隔离到线程中。这个模型主要用在 Windows 操作系统,但也可以用在大多数的 Unix中。要求 PHP 和其扩展在 ZTS 模式下被构建。

这是基于进程的模型:

探索PHP 生命周期

这是基于线程的模型:

探索PHP 生命周期

注意:

作为扩展开发者,PHP 的多进程模块不是你的选择。你将需要支持它。你必须让你的扩展支持在线程环境中运行,特别是在 Windows平台下,并且必须针对它编程。

PHP 扩展钩子

你可能猜到了,PHP 引擎将在多个生命周期点触发你的扩展。我们称它们为钩子函数。你的扩展程序可以在向引擎注册时,通过声明函数钩子来声明对特定生命周期点的兴趣。

在你分析 PHP 扩展结构时(zend_module_entry 结构),这些钩子可以清晰地看到:

  1. struct _zend_module_entry {
  2. unsigned short size;
  3. unsigned int zend_api;
  4. unsigned char zend_debug;
  5. unsigned char zts;
  6. const struct _zend_ini_entry *ini_entry;
  7. const struct _zend_module_dep *deps;
  8. const char *name;
  9. const struct _zend_function_entry *functions;
  10. int (*module_startup_func)(INIT_FUNC_ARGS); /* MINIT() */
  11. int (*module_shutdown_func)(SHUTDOWN_FUNC_ARGS); /* MSHUTDOWN() */
  12. int (*request_startup_func)(INIT_FUNC_ARGS); /* RINIT() */
  13. int (*request_shutdown_func)(SHUTDOWN_FUNC_ARGS); /* RSHUTDOWN() */
  14. void (*info_func)(ZEND_MODULE_INFO_FUNC_ARGS); /* PHPINFO() */
  15. const char *version;
  16. size_t globals_size;
  17. #ifdef ZTS
  18. ts_rsrc_id* globals_id_ptr;
  19. #else
  20. void* globals_ptr;
  21. #endif
  22. void (*globals_ctor)(void *global); /* GINIT() */
  23. void (*globals_dtor)(void *global); /* GSHUTDOWN */
  24. int (*post_deactivate_func)(void); /* PRSHUTDOWN() */
  25. int module_started;
  26. unsigned char type;
  27. void *handle;
  28. int module_number;
  29. const char *build_id;
  30. };

现在让我们看看你应该在这些钩子中编写哪种代码。

模块初始化:MINIT()

这是 PHP 进程启动步骤。在扩展的MINIT()中,你将加载并分配以后每次请求需要的任何持久对象或者信息。它们的大部分将分配为只读对象。

在MINIT()中,尚未有线程或进程弹出,所以你完全可以访问全局变量,而没有任何保护。另外,由于请求尚未启动,因此你不能分配请求绑定的内存。你永远不会在MINIT()步骤中使用Zend 内存管理 分配,但是会使用永久分配。不是 emalloc(),而是pemalloc()。否则会导致崩溃。

在 MINIT()中,执行引擎仍未启动,所以不要在没有特别注意的情况下,尝试访问其任何结构。

如果你需要为你的扩展注册 INI 入口,则MINIT() 是正确的做法。

如果你要为以后使用而注册只读zend_strings,请使用持久分配了。

如果你需要分配的对象在处理请求时会写入,那么你必须复制它们的内存分配到该请求的线程专用池。记住,你只可以在MINIT()中安全地写入全局空间。

注意:

内存管理、分配和调试是内存管理的部分章节。

在 php_module_startup()函数中,通过zend_startup_modules()触发 MINIT()。

模块终止:MSHUTDOWN()

这是 PHP 进程终止步骤。很容易, 基本上,你在这里运行了与MINIT()中使用的相反的操作。你释放了资源,取消 INI 设置的注册等等。

再次注意:执行引擎是关闭的,所以你不应在此处访问其任何变量。

由于你在此处不需要请求,所以不应使用Zend 内存管理 的efree() 或类似函数去释放资源,但对于释放持久分配,使用pefree()。

在php_module_shutdown()函数中,由zend_shutdown()的zend_destroy_modules()中触发MSHUTDOWN()。

请求初始化: RINIT()

刚刚看过的请求,PHP 将在这里处理它。在RINIT()中,你引导了处理该精确请求所需的资源。PHP 是一种无共享架构,它提供了内存管理功能。

在 RINIT()中,如果需要分配动态内存,你将使用Zend 内存管理器。你将调用 emalloc()。Zend 内存管理器 追踪你通过它分配的内存,当请求关闭时,如果你忘记这么做,它将尝试释放请求绑定的内存(你不应这么做)。

在这里,你不应请求持久的动态内存,即 libc 的malloc() 或Zend 的pemalloc()。如果你在这里请求持久内存,并且忘记释放它,则将造成泄露,并且随着 PHP 处理越来越多的请求而堆积,最终导致进程崩溃(Kernel OOM) ,并且导致机器内存不足。

另外,务必注意不要在这里写入全局空间。如果 PHP 作为选定的并行模型运行到线程中,那么你将修改每个线程池中的上下文(所有与你的请求并行处理的请求),并且如果你没有锁定内存,也可能触发竞争条件。如果你需要全局,你必须保护它们。

注意:

全局范围管理解释在专用章节。

在php_request_startup()函数中,通过zend_activate_module()触发RINIT()。

请求终止: RSHUTDOWN()

这是 PHP 请求终止步骤。PHP 刚结束处理其请求,现在来清理其部分作为无共享架构的内存。接下来的请求不应记住当前请求的任何内容。很容易,基本上,你在此处执行了与RINIT()使用的相反的操作。你释放了请求绑定的资源。

由于你在此处使用了请求,你应使用 Zend 内存管理器的efree()或类似方式释放资源。如果你忘记释放并且造成泄露,在调试版本下,内存管理器将在进程stderr上记录关于泄露的指针的日记,并且将为你释放它们。

给你个主意,RSHUTDOWN()将被调用:

执行用户区关闭功能后 (register_shutdown_function())

在调用每个对象析构函数之后

PHP 输出缓冲区刷新之后

禁用 max_execution_time 之后

在php_request_shutdown()函数中,通过zend_deactivate_modules()触发RSHUTDOWN()。

Post 请求终止: PRSHUTDOWN()

这个钩子很少使用。它在 RSHUTDOWN()之后调用,但是中间还会运行一些额外的引擎代码。

尤其是在 Post-RSHUTDOWN 中:

PHP 输出缓冲区已关闭,并且它的处理程序已刷新

PHP 超全局已经销毁

执行引擎已经关闭

这个钩子很少使用。在php_request_shutdown()函数中,通过zend_post_deactivate_modules(),在RSHUTDOWN()之后被触发。

全局初始化: GINIT()

线程库每次弹出线程时都会调用该钩子。如果你使用多进程,当 PHP 启动,仅在触发 MINIT() 之前调用此函数。

这里不讲太多细节,只需在这里简单地初始化全局变量,通常初始化为0。全局管理将在专用章节详细说明。

记住,全局变量不会在每次请求后清理。如果你需要为每次新的请求重置它们(可能),那么你必须将这样地进程放到RINIT()中。

注意:

全局范围管理在专用章节详细介绍。

全局终止: GSHUTDOWN()

在线程库中,每当线程终止时都会调用该钩子。如果你使用多线程,该函数将在 PHP 终止期间(在MSHUTDOWN())被调用一次。

在这里不提供太多细节,你只需简单地在这里取消初始化你的全局变量,通常你不必做什么,但如果在构建全局(GINIT())时分配了资源,在这里的步骤你应该释放它们。

全局管理将在专用章节详细介绍。

记住,全局变量在每次请求后不会清除。即GSHUTDOWN()不会作为RSHUTDOWN()的一部分被调用。

注意:

全局范围管理在专用章节有详细介绍。

信息收集: MINFO()

该钩子很特殊,它永远不会被引擎自动触发,只有你询问它有关扩展的信息时才会触发。典型的例子是调用phpinfo()。然后运行此函数,并将有关当前扩展的特殊信息打印到流中。

简而言之,phpinfo() 展示信息。

该函数也可以通过 CLI 使用反射开关之一调用,例如php --ri pib 或通过用户区调用ini_get_all()。

你可以将其留空,在这种情况下,只有扩展的名字显示,没有其他(可能不会显示 INI 设置,因为这是 MINFO() 的一部分)。

关于 PHP 生命周期的思考

探索PHP 生命周期

你可能已经发现了,RINIT() 和 RSHUTDOWN() 尤其重要,因为它们在扩展中被触发成千上万次。如果 PHP 步骤是关于 Web (不是 CLI),并且已经配置为可以处理无数次请求,那么你的 RINIT()/RSHUTDOWN() 组将被无数次调用。

我们想要再次引起你对内存管理的关注。在处理请求时(在RINIT() 和 RSHUTDOWN()之间),你最终泄露的小字节,将对满载服务器产生严重影响。这就是为什么建议你使用 Zend 内存管理器 进行此类分配,并且准备好调试内存布局。作为无共享架构的一部分,PHP 在每次请求最后都会忘记并释放请求内存,这是 PHP 的内部设计。

另外,如果你的崩溃信号是 SIGSEGV (坏内存访问),则整个进程会崩溃。如果 PHP 是使用线程作为多进程引擎,那么你所有其他线程也将崩溃,甚至可能造成服务器崩溃。

注意:

C 语言不是 PHP 语言。使用 C,在程序的错误很可能导致程序的崩溃与终止。

通过重写函数指针进行挂钩

现在你知道引擎何时会触发代码,还存在值得注意的函数指针,你可以替换它们来挂载到引擎。因为那些指针是全局变量,因此你可以将它们替换为 MINIT() 步骤,并将它们放回MSHUTDOWN()中。

感兴趣的有:

  1. AST, Zend/zend_ast.h:
  2. void (zend_ast_process_t)(zend_ast ast)
  3. Compiler, Zend/zend_compile.h:
  4. zend_op_array (zend_compile_file)(zend_file_handle file_handle, int type)*
  5. zend_op_array (zend_compile_string)(zval source_string, char filename)
  6. Executor, Zend/zend_execute.h:
  7. void (zend_execute_ex)(zend_execute_data execute_data)
  8. void (zend_execute_internal)(zend_execute_data execute_data, zval return_value)*
  9. GC, Zend/zend_gc.h:
  10. int (gc_collect_cycles)(void)*
  11. TSRM, TSRM/TSRM.h:
  12. void (tsrm_thread_begin_func_t)(THREAD_T thread_id)*
  13. void (tsrm_thread_end_func_t)(THREAD_T thread_id)*
  14. Error, Zend/zend.h:
  15. void (zend_error_cb)(int type, const char error_filename, const uint error_lineno, const char format, va_list args)*
  16. Exceptions, Zend/zend_exceptions.h:
  17. void (zend_throw_exception_hook)(zval ex)
  18. Lifetime, Zend/zend.h:
  19. void (zend_on_timeout)(int seconds)*
  20. void (zend_interrupt_function)(zend_execute_data execute_data)
  21. void (zend_ticks_function)(int ticks)*

还有其他存在,但是上面的是最重要的,当你设计 PHP 扩展时,你可能需要。因为它们的名字很容易看,所以不再详细解释它们。

如果你需要更多信息,你可以在 PHP 源代码查看,并发现何时和如何触发它们。