博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
1.4.1python下载网页(每天一更)
阅读量:5299 次
发布时间:2019-06-14

本文共 1812 字,大约阅读时间需要 6 分钟。

# -*- coding: utf-8 -*-'''Created on 2019年4月27日@author: lenovo'''# import urllib3# def download(url):#     return urllib3.connection_from_url(url)# # print(download('http://now.qq.com'))# 在python中,urllib2被urllib。request所取代# import urllib.request# def download(url):#     return urllib.request.urlopen(url).read()# # print(download('https://baijiahao.baidu.com/s?id=1632775818269407606&wfr=spider&for=pc'))# import urllib.request# def download(url):#     print("Downloading:" + url)#     try:#         html = urllib.request.urlopen(url).read()#     except urllib.request.URLError as e:#         print("Download error:" , e.reason)#         html = None#     return html# # print(download("htp://www.baidu.co"))# import urllib.request# def download(url, num_retries=2):#     try:#         html = urllib.request.urlopen(url).read()#     except urllib.request.URLError as e:#         print("Download error:" , e.reason)#         html = None#         if num_retries > 0 :#             if hasattr(e, "code") and 500 <= e.code < 600 :#                 return download(url, num_retries-1)#     return html#     # # print(download("http://httpstat.us/500"))# print(download("http://www.meetup.com/"))import urllib.requestdef download(url, user_agent="wswp",num_retries=2):    print("Downloading: " , url)    headers = { 'User-agent': user_agent}    request = urllib.request.Request(url, headers=headers)    try:        html = urllib.request.urlopen(request).read()    except urllib.request.URLError as e:        print('Download error:' , e.reason)        html = None        if num_retries > 1 :            if hasattr(e, 'code') and 500 <= e.code < 600:                return download(url, user_agent, num_retries-1)    return htmlprint(download("http://www.meetup.com/"))

 

转载于:https://www.cnblogs.com/xww115/p/10822196.html

你可能感兴趣的文章
mysql查询数据库中每一张表的内存大小
查看>>
ThinkPHP函数详解:U方法
查看>>
正则表达式
查看>>
E4 - 使用Model Fragments扩展视图
查看>>
pip install torch on windows, and the 'from torch._C import * ImportError: DLL load failed:' s...
查看>>
zencart iis 伪静态设置 测试可用
查看>>
环套树
查看>>
中英文混合字符串长度
查看>>
[转]Repeat Page Header on each Page for reports SSRS
查看>>
Spring中事务传播行为
查看>>
java基础(一):我对java的三个环境变量的简单理解和配置
查看>>
arcgis api 4.x for js 结合 Echarts4 实现散点图效果(附源码下载)
查看>>
YTU 2734: 国家排序
查看>>
YTU 2625: B 构造函数和析构函数
查看>>
Notepad++ 16进制编辑功能
查看>>
Caffe: Cannot create Cublas handle. Cublas won't be available
查看>>
Linux 下 LXD 容器搭建 Hadoop 集群
查看>>
mysql describe
查看>>
Hello博客园
查看>>
apache自带压力测试工具ab的使用及解析
查看>>