PHP多进程同步下载图片的实现方法,pcntl_fork教程

pcntl_fork — 在当前进程当前位置产生分支(子进程),译注:fork是创建了一个子进程,父进程和子进程 都从fork的位置开始向下继续执行,不同的是父进程执行过程中,得到的fork返回值为子进程号,而子进程得到的是0.

pcntl_fork()函数创建一个子进程,这个子进程仅PID(进程号)和PPID(父进程号)与其父进程不同,fork怎样在您的系统工作的详细信息请查阅您的系统 的fork(2)手册.

注意:PHP有个pcntl_fork的函数可以实现多进程,但要加载pcntl拓展,而且只有在linux下才能编译这个拓展.

1.首先在ubuntu下编译pcntl.so,我的ubuntu下找不到pcntl的包,于是创建一个文件夹下载了整个PHP包,在里面找到了pcntl包运行如下命令,代码如下:

  1. # mkdir php
  2. # cd php
  3. # apt-get source php5
  4. # cd php5-(WHATEVER_RELEASE)/ext/pcntl
  5. # phpize
  6. # ./configure (注一)
  7. # make
  8. # make install phpize 命令是用来准备 PHP 外挂模块的编译环境的

成功的安装将建立 extname.so 并放置于 PHP 的外挂模块目录中(预设存放于 /usr/lib/php/modules/ 内),需要调整 php.ini,加入 extension=extname.so 这一行之后才能使用此外挂模块,代码如下:

  1. void pcntl_exec(string $path [,array $args [,array $envs ]])
  2. pcntl_exec — 在当前进程空间执行指定程序,代码如下:
  3. $cmds=array(
  4. array('/home/jerry/projects/www/test2.php'),
  5. array('/home/jerry/projects/www/test3.php')
  6. );
  7. foreach($cmds as $cmd){
  8. $pid=pcntl_fork();
  9. if($pid==-1){
  10. //进程创建失败
  11. echo '创建子进程失败时返回-1';
  12. exit(-1);
  13. }
  14. else if($pid){
  15. //父进程会得到子进程号,所以这里是父进程执行的逻辑
  16. pcntl_wait($status,WNOHANG);
  17. }
  18. else{
  19. //子进程处理逻辑
  20. sleep(5);
  21. pcntl_exec('/usr/bin/php',$cmd);
  22. exit(0);
  23. }
  24. }

例,实例多图片同步下载,代码如下:

  1. #!/usr/bin/php
  2. <?php
  3. // 需要抓取的网页地址
  4. $url = 'http://www.phpfensi.com';
  5. $content = file_get_contents($url);
  6. preg_match_all('/<imgs+src="(.*?)"/', $content, $matches,PREG_SET_ORDER);
  7. echo "已发现".count($matches)."张图片n";
  8. list($sm, $ss) = explode(" ", microtime());
  9. foreach ($matches as $k => $val)
  10. {
  11. $pid[$k] = pcntl_fork();
  12. if(!$pid[$k])
  13. {
  14. download($url, $val);
  15. // 子进程要exit否则会进行递归多进程,父进程不要exit否则终止多进程
  16. exit(0);
  17. }
  18. if ($pid[$k])
  19. {
  20. // pcntl_waitpid($pid[$k], $status, WUNTRACED);
  21. }
  22. }
  23. echo "下载完成n";
  24. list($em, $es) = explode(" ", microtime());
  25. echo "用时:",($es+$em) - ($ss + $sm),"n";
  26. /**
  27. * 抓取网页图片
  28. *
  29. */
  30. function download($url, $val)
  31. {
  32. $pic_url = $val[1];
  33. if (strpos($val[1], '//') !== false)
  34. {
  35. ;
  36. }
  37. elseif (preg_match('@^(.*?)/@', $val[1], $inner_matches) == 0)
  38. {
  39. $pic_url = $url.$val[1];
  40. }
  41. elseif (preg_match('@[:.]@', $inner_matches[1], $tmp_matches) == 0)
  42. {
  43. $pic_url = $url.$val[1];
  44. }
  45. $pic = file_get_contents($pic_url);
  46. if ($pic === false)
  47. {
  48. return;
  49. }
  50. preg_match('@/([^/]+)$@', $pic_url, $tmp_matches);
  51. // 可使用assert处理异常
  52. $pic_file_name = $tmp_matches[1];
  53. $f = fopen("tmp/".$pic_file_name, "wb"); #
  54. fwrite($f, $pic);
  55. fclose($f);
  56. }
  57. /* End of file pcntl_fork.php */
  58. ?>

多进程同步下载图片是一个非常有用的技术,希望本教程对你有所帮助.