PHP实现爬虫爬取图片代码实例

2023-08-13 10:49•php图像处理•阅读 438

这篇文章主要介绍了PHP实现爬虫爬取图片代码实例，有实际的代码例子，感兴趣的同学可以尝试下。

文字信息

我们尝试获取表的信息，这里，我们就用某校的课表来代替：

接下来我们就上代码：

a.php

<?php
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下：

成功获取到课表；

图片获取

绝对链接

我们以百度图库的首页为例

b.php

<?php
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
echo "<img src=$key>";
}

然后，我们就获得了下面的页面：

相对链接

百度图库的图片的链接大部分是绝对链接，那么当我们遇到网页图片为相对链接的时候，我们该怎么处理呢？其实很简单，我们只需要将循环那部分改为

那么我们就可以同样在浏览器中输出图片了；

赞 (5)

如何在无显示器的ubuntu下跑前端测试--table

上一篇5-24

PHP 简易爬虫

下一篇 7-5

PHP实例：上传多个图片并校验的代码
PHP实例：上传多个图片并校验的代码单张的图片上传是不复杂的，这里涉及到多张图片上传和对图片格式的校验，保证上传的一定是图片，防止上传其他文件到服务器。基本实现算法是使用数组的形式，把所有的图片提交个一个数组，对数组的元素进行一个个的处理。…
•php上传下载
2015-12-2617926
PHP 下载远程网页图片并且保存在本地实例
我们要取远程服务器中网页的图片然后保存到我们本地需要珍到phpfopen或curl等等这类的函数,下面我给大家介绍几个常用的实例.fopen函数实例ob_start:打开输出缓冲readfile:读入一个文件并写入到输出缓冲返回从文件中读入的字节数,如果出错返回FALSE并且除非是以@readfile()形式调用,否则会显示错误信息.ob_get_contents:Returnthecontent…
•php图像处理
2023-06-03913
php模仿百度spider蜘蛛爬虫程序例子
下面来看一个php模仿百度spider蜘蛛爬虫程序例子,这个代码写得比较高级了我就不分析了,大家有需要的可以进入参考一下吧.自己用PHP写了个爬虫,基本功能已经实现,有兴趣的可以试试脚本缺点:1.未对静态页面进行去重处理,2.未对页面内js操作后的结果进行处理php模仿百度spider蜘蛛爬虫程序例子代码如下:<?php#加载页面functioncurl_get($url){$ch=curl…
•php高级应用
2023-06-05695
php实现图片转换成ASCII码的方法
这篇文章主要介绍了php实现图片转换成ASCII码的方法,涉及php操作图片的技巧,需要的朋友可以参考下。本文实例讲述了php实现图片转换成ASCII码的方法，分享给大家供大家参考，具体如下：php图片转换成ASCII码，转换后可以直接通过字符串显示图片<html><head><title>Ascii</title><style>body…
•php图像处理
2023-06-15725
php中怎么让json_encode不自动转义斜杠“/”？
php中怎么让json_encode不自动转义斜杠“/”？下面本篇文章给大家介绍一下PHP中让json_encode不自动转义斜杠“/”的方法，有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。最近将使用爬虫爬取的链接保存到mysql数据库中时，发现我将链接使用json_encode保存时候，在数据库中却显示了转义字符，我并不需要这转义的，看起来不清晰而且占用存储空间。后来发现在默认…
•php应用
2023-06-161022
php把汉字转换成拼音代码
下面有三个函数对应的是取汉字码,与转换成相对就的拼音,我们的实例是简单的,只举了a开头的汉字转换拼音的实例代码.$piny=array('a'=>-20319,'ai'=>-20317,'an'=>-20304,'ang'=>-20295);echogetChineseSpells('中国WEB第一站www.phpfensi.com');//取汉字所有拼音functiong…
•php函数
2023-07-12610
php生成随机密码实现函数总结
根据我的理解php生成随机密码就是我们把一些要生成的字符预置一个的字符串包括数字拼音之类的以及一些特殊字符,这样我们再随机取字符组成我们想要的随机密码了.下面总结了一些实例各位朋友可参考.例1,最简洁的生成方法,代码如下:functiongeneratePassword($length=8){$chars=array_merge(range(0,9),range('a','z'),range('A…
•php函数
2023-07-13664
php中四舍五入取整函数详细介绍
本文章中我们介绍了php中四个常用的取整和四舍五入函数ceil,floor,round,intval,下面我们来详细介绍.ceil—进一法取整说明floatceil(floatvalue)返回不小于value的下一个整数,value如果有小数部分则进一位.ceil()返回的类型仍然是float,因为float值的范围通常比integer要大.例子1.ceil()例子实例代码如下:<?phpe…
•php函数
2023-07-14471