python爬蟲之使用user-agent的注意事項-創(chuàng)新互聯(lián)

這篇文章給大家分享的是有關(guān)python爬蟲之使用user-agent的注意事項的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

成都創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比雞東網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式雞東網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋雞東地區(qū)。費用合理售后完善,10余年實體公司更值得信賴。

我們在寫爬蟲,構(gòu)建網(wǎng)絡(luò)請求的時候,不可避免地要添加請求頭( headers ),以 mdn 學(xué)習(xí)區(qū)為例,我們的請求頭是這樣的:

python爬蟲之使用user-agent的注意事項

一般來說,我們只要添加 user-agent 就能滿足絕大部分需求了,Python 代碼如下:

import requests
 
headers = {
    #'authority': 'developer.mozilla.org',
    #'pragma': 'no-cache',
    #'cache-control': 'no-cache',
    #'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
    #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
    #'accept-encoding': 'gzip, deflate, br',
    #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
    #'cookie': 你的cookie,
}
 
response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)


但是有些請求,我們要把特定的 headers 參數(shù)添加上才能獲得正確的網(wǎng)絡(luò)響應(yīng),不知道哪個參數(shù)是必要的情況下,就要先把所有參數(shù)都添加上,再逐個排除。

但是手動復(fù)制粘貼 headers 字典里的每一個鍵值對太費事了。

感謝各位的閱讀!關(guān)于python爬蟲之使用user-agent的注意事項就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

標(biāo)題名稱:python爬蟲之使用user-agent的注意事項-創(chuàng)新互聯(lián)
本文鏈接:http://www.muchs.cn/article4/pesie.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版標(biāo)簽優(yōu)化、虛擬主機(jī)、定制開發(fā)Google、ChatGPT

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司