php正则匹配html中带class的div并选取其中内容的方法

这篇文章主要介绍了php正则匹配html中带class的div并选取其中内容的方法,涉及curl的使用及正则匹配的技巧,具有一定参考借鉴价值,需要的朋友可以参考下

本文实例讲述了php正则匹配html中带class的div并选取其中内容的方法。分享给大家供大家参考。具体分析如下:

先看一段html代码:

  1. <div class="chartInfo">
  2. <div class="line"></div>
  3. <div class="tideTable">
  4. <strong>潮汐表</strong>数据仅供参考
  5. <table width="500" cellspacing="0" cellpadding="0">
  6. <tbody><tr>
  7. <td width="100"><p><span>潮时 (Hrs)</span></p></td>
  8. <td width="100"><p>00:58</p></td>
  9. <td width="100"><p>05:20</p></td>
  10. <td width="100"><p>13:28</p></td>
  11. <td width="100"><p>21:15</p></td>
  12. </tr>
  13. <tr>
  14. <td><p><span>潮高 (cm)</span></p></td>
  15. <td width="100"><p>161</p></td>
  16. <td width="100"><p>75</p></td>
  17. <td width="100"><p>288</p></td>
  18. <td width="100"><p>127</p></td>
  19. </tr>
  20. </tbody></table>
  21. <h2>时区:-1000 (东10区) 潮高基准面:在平均海平面下174CM</h2>
  22. </div>
  23. <div class="chart">
  24. </div>
  25. </div>

这是源程序里边的一部分,为了容易看懂,删减了一大部分,只取<div class="tideTable"> div块中的内容,首页先用file_get_content或curl获取内容部分,我用的是curl,代码如下:

  1. $ch = curl_init();
  2. curl_setopt($ch, CURLOPT_URL, $url);
  3. curl_setopt($ch, CURLOPT_POST, 1);
  4. curl_setopt( $ch, CURLOPT_HEADER, 0 );
  5. curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 1 );
  6. curl_setopt( $ch, CURLOPT_POSTFIELDS, $data );
  7. $return = curl_exec( $ch );
  8. curl_close( $ch );
  9. $regex4="/<div class=\"tideTable\".*?>.*?<\/div>/ism";
  10. if(preg_match_all($regex4, $return, $matches)){
  11. print_r($matches);
  12. }else{
  13. echo '0';
  14. }

这样就可以了,不多解释,懂PHP的看代码,打印看一下效果。