博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
urlretrieve()函数下载图片
阅读量:5886 次
发布时间:2019-06-19

本文共 1075 字,大约阅读时间需要 3 分钟。

天堂图片网下载,将img标签中的src属性提取出来,交给

urllib.request.urlretrieve函数【urllib.urlretrieve(python2中)】自动回调Schedule函数,显示当前下载进度,
Schedule包含3个参数
blocknum:已经下载的数据块     blocksize:数据块的大小     totalsize:远程文件的大小
 
1 import urllib.request 2 from lxml import etree 3 import requests 4 def Schedule(blocknum,blocksize,totalsize): 5     ''''' 6     blocknum:已经下载的数据块 7     blocksize:数据块的大小 8     totalsize:远程文件的大小 9     '''10     per = 100.0 * blocknum * blocksize / totalsize11     if per > 100 :12         per = 10013     print('当前下载进度:%d'%per)14 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'15 headers={
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}16 r = requests.get('http://www.ivsky.com/tupian/ziranfengguang/',headers=headers)17 #使用lxml解析网页18 html = etree.HTML(r.text)19 img_urls = html.xpath('.//img/@src')#先找到所有的img20 i=021 for img_url in img_urls:22 urllib.request.urlretrieve(img_url,'img'+str(i)+'.jpg',Schedule)23 i+=1

 

转载于:https://www.cnblogs.com/wanglinjie/p/9250531.html

你可能感兴趣的文章
Linux下vmstat结果详解
查看>>
USE_HASH
查看>>
Linux Eclipse美化:解决工具栏过大和 Javadoc背景色修改
查看>>
Jeesite中shiro的用法讲解
查看>>
svn钩子
查看>>
RabbitMQ安装、配置、基本使用
查看>>
NFS读写块大小分析
查看>>
javascript预编译和处理的问题
查看>>
云计算之openstack-newton版搭建(二)
查看>>
GCC 源码安装
查看>>
学习Linux旅途--Day Four--
查看>>
机器学习——K-近邻(KNN)算法
查看>>
Exchange 日常管理六之:创建邮箱数据库
查看>>
LVS(Linux Virtual Server)三种负载均衡模型和十种调度的简单介绍
查看>>
JavaScript常用代码(不定时更新)
查看>>
git/github使用初探
查看>>
Windows Server 磁盘空间不足怎么办
查看>>
PMP考前复习题 系列一
查看>>
Oracle 数据完整性(学习笔记)
查看>>
我的友情链接
查看>>