www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]User Agent的方法先看下urllib.request.Request()????從上圖可以看出,在創(chuàng)建Request對(duì)象的時(shí)候,可以傳入headers參數(shù)。?????因此,想要設(shè)置User A

User Agent的方法


先看下urllib.request.Request()

????從上圖可以看出,在創(chuàng)建Request對(duì)象的時(shí)候,可以傳入headers參數(shù)。?
????因此,想要設(shè)置User Agent,有兩種方法:

????1.在創(chuàng)建Request對(duì)象的時(shí)候,填入headers參數(shù)(包含User Agent信息),這個(gè)Headers參數(shù)要求為字典;

????2.在創(chuàng)建Request對(duì)象的時(shí)候不添加headers參數(shù),在創(chuàng)建完成之后,使用add_header()的方法,添加headers。

方法一:

????創(chuàng)建文件urllib_test09.py,使用上面提到的Android的第一個(gè)User Agent,在創(chuàng)建Request對(duì)象的時(shí)候傳入headers參數(shù),編寫(xiě)代碼如下:

#?-*-?coding:?UTF-8?-*-
from?urllib?import?request

if?__name__?==?"__main__":
????#以CSDN為例,CSDN不更改User?Agent是無(wú)法訪問(wèn)的
????url?=?'http://www.csdn.net/'
????head?=?{}
????#寫(xiě)入U(xiǎn)ser?Agent信息
????head['User-Agent']?=?'Mozilla/5.0?(Linux;?Android?4.1.1;?Nexus?7?Build/JRO03D)?AppleWebKit/535.19?(KHTML,?like?Gecko)?Chrome/18.0.1025.166??Safari/535.19'
?#創(chuàng)建Request對(duì)象
????req?=?request.Request(url,?headers=head)
????#傳入創(chuàng)建好的Request對(duì)象
????response?=?request.urlopen(req)
????#讀取響應(yīng)信息并解碼
????html?=?response.read().decode('utf-8')
????#打印信息
????print(html)

????運(yùn)行結(jié)果如下:

方法二:

????創(chuàng)建文件urllib_test10.py,使用上面提到的Android的第一個(gè)User Agent,在創(chuàng)建Request對(duì)象時(shí)不傳入headers參數(shù),創(chuàng)建之后使用add_header()方法,添加headers,編寫(xiě)代碼如下:

#?-*-?coding:?UTF-8?-*-
from?urllib?import?request

if?__name__?==?"__main__":
????#以CSDN為例,CSDN不更改User?Agent是無(wú)法訪問(wèn)的
????url?=?'http://www.csdn.net/'
????#創(chuàng)建Request對(duì)象
????req?=?request.Request(url)
????#傳入headers
????req.add_header('User-Agent',?'Mozilla/5.0?(Linux;?Android?4.1.1;?Nexus?7?Build/JRO03D)?AppleWebKit/535.19?(KHTML,?like?Gecko)?Chrome/18.0.1025.166??Safari/535.19')
????#傳入創(chuàng)建好的Request對(duì)象
????response?=?request.urlopen(req)
????#讀取響應(yīng)信息并解碼
????html?=?response.read().decode('utf-8')
????#打印信息
????print(html)

????運(yùn)行結(jié)果和上一個(gè)方法是一樣的。

IP代理的使用


1.為何使用IP代理

????User Agent已經(jīng)設(shè)置好了,但是還應(yīng)該考慮一個(gè)問(wèn)題,程序的運(yùn)行速度是很快的,如果我們利用一個(gè)爬蟲(chóng)程序在網(wǎng)站爬取東西,一個(gè)固定IP的訪問(wèn)頻率就會(huì)很高,這不符合人為操作的標(biāo)準(zhǔn),因?yàn)槿瞬僮鞑豢赡茉趲譵s內(nèi),進(jìn)行如此頻繁的訪問(wèn)。所以一些網(wǎng)站會(huì)設(shè)置一個(gè)IP訪問(wèn)頻率的閾值,如果一個(gè)IP訪問(wèn)頻率超過(guò)這個(gè)閾值,說(shuō)明這個(gè)不是人在訪問(wèn),而是一個(gè)爬蟲(chóng)程序。

2.一般步驟說(shuō)明

????一個(gè)很簡(jiǎn)單的解決辦法就是設(shè)置延時(shí),但是這顯然不符合爬蟲(chóng)快速爬取信息的目的,所以另一種更好的方法就是使用IP代理。使用代理的步驟:

????(1)調(diào)用urlib.request.ProxyHandler(),proxies參數(shù)為一個(gè)字典。

????(2)創(chuàng)建Opener(類(lèi)似于urlopen,這個(gè)代開(kāi)方式是我們自己定制的)

????(3)安裝Opener

????使用install_opener方法之后,會(huì)將程序默認(rèn)的urlopen方法替換掉。也就是說(shuō),如果使用install_opener之后,在該文件中,再次調(diào)用urlopen會(huì)使用自己創(chuàng)建好的opener。如果不想替換掉,只是想臨時(shí)使用一下,可以使用opener.open(url),這樣就不會(huì)對(duì)程序默認(rèn)的urlopen有影響。

3.代理IP選取

????在寫(xiě)代碼之前,先在代理IP網(wǎng)站選好一個(gè)IP地址,推薦西刺代理IP。

????URL:http://www.xicidaili.com/

????注意:當(dāng)然也可以寫(xiě)個(gè)正則表達(dá)式從網(wǎng)站直接爬取IP,但是要記住不要太頻繁爬取,加個(gè)延時(shí)什么的,太頻繁給服務(wù)器帶來(lái)壓力了,服務(wù)器會(huì)直接把你block,不讓你訪問(wèn)的,我就被封了兩天。

????從西刺網(wǎng)站選出信號(hào)好的IP,我的選擇如下:(106.46.136.112:808)

????編寫(xiě)代碼訪問(wèn)http://www.whatismyip.com.tw/,該網(wǎng)站是測(cè)試自己IP為多少的網(wǎng)址,服務(wù)器會(huì)返回訪問(wèn)者的IP。

4.代碼實(shí)例

????創(chuàng)建文件urllib_test11.py,編寫(xiě)代碼如下:

#?-*-?coding:?UTF-8?-*-
from?urllib?import?request

if?__name__?==?"__main__":
????#訪問(wèn)網(wǎng)址
????url?=?'http://www.whatismyip.com.tw/'
????#這是代理IP
????proxy?=?{'http':'106.46.136.112:808'}
????#創(chuàng)建ProxyHandler
????proxy_support?=?request.ProxyHandler(proxy)
????#創(chuàng)建Opener
????opener?=?request.build_opener(proxy_support)
????#添加User?Angent
????opener.addheaders?=?[('User-Agent','Mozilla/5.0?(Windows?NT?6.1;?Win64;?x64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/56.0.2924.87?Safari/537.36')]
????#安裝OPener
????request.install_opener(opener)
????#使用自己安裝好的Opener
????response?=?request.urlopen(url)
????#讀取相應(yīng)信息并解碼
????html?=?response.read().decode("utf-8")
????#打印信息
????print(html)

????運(yùn)行結(jié)果如下:

????從上圖可以看出,訪問(wèn)的IP已經(jīng)偽裝成了106.46.136.112。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉