解决php curl_multi批处理造成CPU负载过高问题

今天在利用curl_multi函数来获取一些外网内容时发现只要一运行curl_multi函数我的cpu就占得非常的高,后来看一站长分享了此问题解决方法我也整理一下与各位分享一下,希望对大家有帮助.

简单的cURL处理如下,代码如下:

  1. $ch = curl_init();
  2. curl_setopt($ch, CURLOPT_URL, 'http://www.phpfensi.com');
  3. curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
  4. $con = curl_exec($ch);
  5. curl_close($ch);

cURL还提供了批量处理会话,下面是cURL批量处理相关函数:

curl_multi_init — 返回一个新cURL批处理句柄

curl_multi_add_handle — 向curl批处理会话中添加单独的curl句柄

curl_multi_exec — 解析一个cURL批处理句柄

curl_multi_getcontent — 如果设置了CURLOPT_RETURNTRANSFER,则返回获取的输出的文本流

curl_multi_select — 等待所有cURL批处理中的活动连接

curl_multi_info_read — 获取当前解析的cURL的相关传输信息

curl_multi_remove_handle — 移除curl批处理句柄资源中的某个句柄资源

curl_multi_close — 关闭一组cURL句柄

看下面使用curl multi批处理的例子,代码如下:

  1. /**
  2. * cURL multi批量处理
  3. *
  4. * @author mckee
  5. * @link http://www.phpfensi.com
  6. *
  7. */
  8. $url_array = array(
  9. 'http://www.phpfensi.net/',
  10. 'http://www.phpfensi.net/php/627.html',
  11. 'http://www.phpfensi.net/php/258.html'
  12. );
  13. $handles = $contents = array();
  14. //初始化curl multi对象
  15. $mh = curl_multi_init();
  16. //添加curl 批处理会话
  17. foreach($url_array as $key => $url)
  18. {
  19. $handles[$key] = curl_init($url);
  20. curl_setopt($handles[$key], CURLOPT_RETURNTRANSFER, 1);
  21. curl_setopt($handles[$key], CURLOPT_TIMEOUT, 10);
  22. curl_multi_add_handle($mh, $handles[$key]);
  23. }//开源代码phpfensi.com
  24. //======================执行批处理句柄=================================
  25. $active = null;
  26. do {
  27. $mrc = curl_multi_exec($mh, $active);
  28. } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  29. while ($active and $mrc == CURLM_OK) {
  30. if(curl_multi_select($mh) === -1){
  31. usleep(100);
  32. }
  33. do {
  34. $mrc = curl_multi_exec($mh, $active);
  35. } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  36. }
  37. //====================================================================
  38. //获取批处理内容
  39. foreach($handles as $i => $ch)
  40. {
  41. $content = curl_multi_getcontent($ch);
  42. $contents[$i] = curl_errno($ch) == 0 ? $content : '';
  43. }
  44. //移除批处理句柄
  45. foreach($handles as $ch)
  46. {
  47. curl_multi_remove_handle($mh, $ch);
  48. }
  49. //关闭批处理句柄
  50. curl_multi_close($mh);
  51. print_r($contents);

上面这段程序重点是执行批处理的那段,普通的处理,代码如下:

do { $n=curl_multi_exec($mh,$active); } while ($active);

会造成CPU Loading过高,因为$active要等全部url数据接受完毕才变成false,所以这里用到了curl_multi_exec的返回值判断是否还有数据,当有数据的时候就不停调用curl_multi_exec,没有执行数据就会sleep,如此就会避免CPU Loading 100%了.