网站建设资讯

NEWS

网站建设资讯

python爬虫中伪装浏览器的方法-创新互联

小编给大家分享一下python爬虫中伪装浏览器的方法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

创新互联主营洪湖网站建设的网络公司,主营网站建设方案,成都App制作,洪湖h5微信小程序开发搭建,洪湖网站营销推广欢迎洪湖等地区企业咨询

实现伪装浏览器须知:

我们如果想去获取某些内容,得先让自己和他们处于同类,这样才不会被攻击,才可以跟对手网站和平相处,接收到他们的信息。引入ProxyHandler组件,访问需要通过build_opener调用handler来实现。

实现代码如下:

from urllib.request import Request, build_opener
from fake_useragent import UserAgent
from urllib.request import ProxyHandler
url = "http://httpbin.org/get"
headers={
 "User-Agent": UserAgent().chrome
}
request = Request(url, headers=headers)
handler = ProxyHandler({"http" : "112.85.129.8:9999"})
opener = build_opener(handler)
response = opener.open(request)
print(response.read().decode())

测试结果

先运行程序看看目前没有用代理的时候IP的信息

python爬虫中伪装浏览器的方法

再看看利用了proxy之后产生的结果

python爬虫中伪装浏览器的方法

以上是“python爬虫中伪装浏览器的方法”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注创新互联行业资讯频道!


当前题目:python爬虫中伪装浏览器的方法-创新互联
文章网址:http://cdweb.net/article/cohgps.html