如何通过requests使用代理IP进行爬虫工作 - 站大爷

注册: 登录

每月知识问答

2019年4月5 篇
2019年3月18 篇
2019年2月6 篇
2019年1月5 篇
2018年12月10 篇
2018年11月11 篇
2018年10月7 篇
2018年9月19 篇
2018年8月13 篇
2018年7月14 篇
2018年6月13 篇
2018年5月11 篇
2018年4月8 篇
2018年3月10 篇
2018年2月3 篇
2018年1月12 篇
2017年12月20 篇
2017年11月21 篇
2017年10月12 篇
2017年9月21 篇
2017年8月24 篇
2016年11月16 篇
2016年10月31 篇
2016年9月21 篇
2016年8月31 篇
2016年7月51 篇
2016年6月129 篇

如何通过requests使用代理IP进行爬虫工作

提问时间：2018/9/27 14:44:42

我们知道，一些网站会有相应的反爬虫措施，比如检测某些IP的访问次数或者访问频率，有些反人类的访问速度就会收到限制甚至封禁，所以在进行爬虫工作时也要讲究策略，比如使用代理IP，调整访问频率，设置UA等等，让我们来看看如何简单的使用代理IP。

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import requests

import random

if __name__ == "__main__":

#不同浏览器的UA

header_list = [

# 遨游

{"user-agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)"},

# 火狐

{"user-agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"},

# 谷歌

{

"user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"}

]

#不同的代理IP(该代理ip可能已经失效，请自行去站大爷网站上购买开通)

proxy_list = [

{"http": "112.115.57.20:33128"},

{‘http‘: ‘121.41.171.223:32128‘}

]

#随机获取UA和代理IP

header = random.choice(header_list)

proxy = random.choice(proxy_list)

url = ‘http://www.baidu.com/s?ie=UTF-8&wd=ip‘

#参数3：设置代理

response = requests.get(url=url,headers=header,proxies=proxy)

response.encoding = ‘utf-8‘

with open(‘daili.html‘, ‘wb‘) as fp:

fp.write(response.content)

#切换成原来的IP

requests.get(url, proxies={"http": ""})

推荐阅读

◆  某网站仅某些地区用户可以登录（例如仅欧洲地区用户可以登录）。如果我不处在这个地区，如何想办法登陆？
◆  别人能查到你的ip并找到你的住址吗？
◆  Python 爬虫如何破解ip限制，让网站无法屏蔽？
◆  IP地址段表示方法批量转换的方法或工具有哪些？
◆  https和http有什么区别，有什么优势
◆  菜鸟学会爬虫技术用什么方式最快呀？
◆  代理IP分类以及识别技术探讨
◆  如何使用代理IP增加某网站文章浏览量
◆  ADSL接入获得的IP或者说向运营商缴费上网获得的IP是全世界真实且唯一的吗?
◆  计算机领域有哪些像《鸟哥的Linux私房菜》这样通俗易懂的学习资料？

立即注册站大爷用户，免费试用全部产品

立即注册站大爷用户，免费试用全部产品

快速咨询热线：

024-31823261

国家高新技术企业证书编号：GR202321001563
增值电信经营许可证：辽B2-20180026
互联网虚拟专用网业务许可证：B1-20181940
公司地址：沈阳市浑南区上深沟村沈阳国际软件园F7座

产品

支持

文档

关于

声明：本站不搜集数据不存储数据，也不买卖数据，所有资源仅用作数据传输通道。禁止利用本平台资源从事任何违反本国（地区）法律法规的活动，用户所有操作行为均有日志存档并保留6个月。

站大爷 - 专注企业级代理IP云服务 Copyright@2026 | 辽B2-20180026