python如何下載網(wǎng)頁源碼

python如何下載網(wǎng)頁源碼?針對這個問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

蘄春網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)公司,蘄春網(wǎng)站設(shè)計制作,有大型網(wǎng)站制作公司豐富經(jīng)驗。已為蘄春上千提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站建設(shè)要多少錢,請找那個售后服務(wù)好的蘄春做網(wǎng)站的公司定做!

python可以下載網(wǎng)頁的源代碼,使用urllib庫,或者使用更為方便的requests庫。

import urllib2
def download(url, num_retries = 5):
    '''
    function: 下載網(wǎng)頁源代碼,如果遇到 5xx 錯誤狀態(tài),則繼續(xù)嘗試下載,直到下載 num_retries 次為止。
    '''
    print "downloading " , url
    try:
        html = urllib2.urlopen(url).read()
    except urllib2.URLError as e:
        print "download error: " , e.reason
        html = None
        if num_retries > 0:
            if hasattr(e,'code') and 500 <= e.code < 600:
                return download(url, num_retries-1)

    return html

其中 url 即為你想現(xiàn)在的網(wǎng)頁地址。 num_reties 為遇到 5xx 錯誤的時候,重試下載的次數(shù)。

關(guān)于python如何下載網(wǎng)頁源碼問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。

分享文章:python如何下載網(wǎng)頁源碼
文章位置:http://muchs.cn/article18/jehdgp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營銷關(guān)鍵詞優(yōu)化、服務(wù)器托管、網(wǎng)站內(nèi)鏈、品牌網(wǎng)站制作、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化