php数组交集判断与优化程序代码

昨天我有一个功能是需要判断生成的多个数组交集,也就是要判断这些数组中是否存在交集了,下面我来给各位同学介绍php数组交集判断程序代码实例,有需要的朋友可参考.

需要判断两个数组是否有交集,第一个感觉PHP中应该有这个函数,果然:

array array_intersect(array array1,array array2[,arrayN…])

返回N个数组中的交集元素,如果是关联数组可以用:array_intersect_assoc()

PHP案例如下:

数组的交集 array_intersect()

array_intersect()函数返回一个保留了键的数组,这个数组只由第一个数组中出现的且在其他每个输入数组中都出现的值组成,其形式如下:

  1. <?php
  2. $fruit1 = array("Apple","Banana","Orange");
  3. $fruit2 = array("Pear","Apple","Grape");
  4. $fruit3 = array("Watermelon","Orange","Apple");
  5. $intersection = array_intersect($fruit1, $fruit2, $fruit3);
  6. print_r($intersection);
  7. // 输出 Array ( [0] => Apple )
  8. ?>

我的应用如下:

  1. if($user->role != 1){
  2. $count = count($projects);
  3. for($i=0;$i<$count;$i++){
  4. if(!array_intersect(explode(',', $projects[$i]['role']), explode(',', $projects[$i]['next_approve_role']))){
  5. unset($projects[$i]);
  6. continue;
  7. }
  8. }
  9. }

关联数组的交集array_intersect_assoc(),代码如下:

  1. <?php
  2. $fruit1 = array("red"=>"Apple","yellow"=>"Banana","orange"=>"Orange");
  3. $fruit2 = array("yellow"=>"Pear","red"=>"Apple","purple"=>"Grape");
  4. $fruit3 = array("green"=>"Watermelon","orange"=>"Orange","red"=>"Apple");
  5. $intersection = array_intersect_assoc($fruit1, $fruit2, $fruit3);
  6. print_r($intersection);
  7. // output
  8. // Array ( [red] => Apple )
  9. ?>

数组交集的优化,假定每个参数会包含一千个左右的产品ID(int),以此为前提来模拟生成一些数据,代码如下:

  1. <?php
  2. $rand = function() {
  3. $result = array();
  4. for ($i = 0; $i < 1000; $i++) {
  5. $result[] = mt_rand(1, 10000);
  6. }
  7. return $result;
  8. };
  9. $param_a = $rand();
  10. $param_b = $rand();
  11. ?>

注意:如果测试数据集过小的话,结论可能会出现不一致,先看看通过PHP内置方法array_intersect实现的性能,代码如下:

  1. <?php
  2. $time = microtime(true);
  3. $result = array_intersect($param_a, $param_b);
  4. $time = microtime(true) - $time;
  5. echo "array_intersect: {$time}n";
  6. ?>

在优化之前,我们先来看看array_intersect一些特殊的地方,代码如下:

  1. <?php
  2. $param_a = array(1, 2, 2);
  3. $param_b = array(1, 2, 3);
  4. var_dump(
  5. array_intersect($param_a, $param_b),
  6. array_intersect($param_b, $param_a)
  7. );
  8. ?>
  9. array_intersect($param_a, $param_b): 1, 2, 2
  10. array_intersect($param_b, $param_a): 1, 2

也就是说,如果在第一个数组参数中有重复元素的话,则array_intersect会返回所有满足条件的重复元素,改写array_intersect的时候最好兼容这些功能.

下面看看通过自定义方法int_array_intersect实现的性能,代码如下:

  1. <?php
  2. function int_array_intersect()
  3. {
  4. if (func_num_args() < 2) {
  5. trigger_error('param error', E_USER_ERROR);
  6. }
  7. $args = func_get_args();
  8. foreach ($args AS $arg) {
  9. if (!is_array($arg)) {
  10. trigger_error('param error', E_USER_ERROR);
  11. }
  12. }
  13. $intersect = function($a, $b) {
  14. $result = array();
  15. $length_a = count($a);
  16. $length_b = count($b);
  17. for ($i = 0, $j = 0; $i < $length_a && $j < $length_b; null) {
  18. if($a[$i] < $b[$j] && ++$i) {
  19. continue;
  20. }
  21. if($a[$i] > $b[$j] && ++$j) {
  22. continue;
  23. }
  24. $result[] = $a[$i];
  25. if (isset($a[$next = $i + 1]) && $a[$next] != $a[$i]) {
  26. ++$j;
  27. }
  28. ++$i;
  29. }
  30. return $result;
  31. };
  32. $result = array_shift($args);
  33. sort($result);
  34. foreach ($args as $arg) {
  35. sort($arg);
  36. $result = $intersect($result, $arg);
  37. }//开源代码phpfensi.com
  38. return $result;
  39. }
  40. $time = microtime(true);
  41. $result = int_array_intersect($param_a, $param_b);
  42. $time = microtime(true) - $time;
  43. echo "int_array_intersect: {$time}n";
  44. ?>

直觉上,我们肯定会认为内置函数快于自定义函数,但本例中结果恰恰相反:

array_intersect: 0.023918151855469

int_array_intersect: 0.0026049613952637