Python如何爬取美劇隨時(shí)看-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!

成都創(chuàng)新互聯(lián)主要從事成都做網(wǎng)站、網(wǎng)站制作、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)鐵嶺,10年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):028-86922220

這篇文章主要介紹Python如何爬取美劇隨時(shí)看,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

最早一部《越獄》轉(zhuǎn)變了我對(duì)美劇的看法。主人公scofield的聰明才智和堅(jiān)強(qiáng)的毅力,《絕命毒師》里面主人公的中年逆襲,《紙牌屋》里面老謀深算的政客,等等,這些美劇和里面鮮活的任務(wù),至今令人記憶尤新。

最近,又迷上了美劇,無奈多數(shù)視頻平臺(tái)上的美劇都是收費(fèi)的。對(duì)于一個(gè)資深Pythoner,我們可以用Python自動(dòng)獲取美劇的網(wǎng)址,下載了慢慢看。

Python如何爬取美劇隨時(shí)看

我們以天天看M劇這個(gè)網(wǎng)站為例,來展示如何分析和下載這些內(nèi)容,這里提供一種思路供大家學(xué)習(xí)。當(dāng)然,我們還是得支持正版內(nèi)容,這里是介紹技術(shù),大家勿用于非法用途哦,電影下載后請(qǐng)遵照網(wǎng)站協(xié)議及時(shí)刪除。

準(zhǔn)備網(wǎng)址

網(wǎng)址大家自己找。我們?cè)谥黜撍阉鳌拔C(jī)邊緣”

Python如何爬取美劇隨時(shí)看

然后我們獲得1-5季的網(wǎng)址內(nèi)容,如下圖

Python如何爬取美劇隨時(shí)看

我們知道了1-5季的網(wǎng)址信息,然后,我們來看一下每一個(gè)頁面的結(jié)構(gòu)。

分析頁面內(nèi)容

我們打開第一季的頁面,看下需要獲取的內(nèi)容,如下圖:

Python如何爬取美劇隨時(shí)看

我們需要的是每一集的網(wǎng)址信息(上圖中紅色框線中的內(nèi)容),通過將各個(gè)季的每一集網(wǎng)址內(nèi)容下載下來,按季保存為txt文件,然后使用下載工具導(dǎo)入下載即可。

Python如何實(shí)現(xiàn)

我們知道,爬取信息主要使用的一些經(jīng)典庫。

Python如何爬取美劇隨時(shí)看

我們這里主要使用兩個(gè)經(jīng)典的庫requests和bs4。親測(cè)該網(wǎng)站沒有反爬措施,因此我們沒有涉及這些內(nèi)容,感興趣的小伙伴自己學(xué)習(xí)下相關(guān)內(nèi)容。

Python如何爬取美劇隨時(shí)看

我們的一般思路是這樣的,下面來看下Python實(shí)現(xiàn)過程。

我們定義三個(gè)函數(shù),主要代碼如下:

【獲取網(wǎng)頁內(nèi)容】

def getHtml(url):
return requests.get(url)

直接返回了網(wǎng)頁的文本內(nèi)容。

【獲取每頁網(wǎng)址信息】

def getInfo(html):
lst = []
bs = BeautifulSoup(html.text, 'html.parser')
urls = bs.findAll('tbody')[0]
for item in urls.findAll('a'):
lst.append((item.get("href"), item.text))
return lst

傳入每一季的頁面內(nèi)容,以列表信息返回每一集的網(wǎng)址和每一集的名字。

【保存內(nèi)容】

def saveInfo(name, lst):
with open('第{}季.txt'.format(name), 'w') as f:
for item in lst:
f.write(item[0] + '\n')

傳入每一季的名稱的該季中的每一集的網(wǎng)址列表,保存在本地。

做輪子

沒錯(cuò),簡(jiǎn)單的三步實(shí)現(xiàn)了我們需要的效果。下面,我們開始“造輪子”。

Python如何爬取美劇隨時(shí)看

下面我們來看看我們實(shí)現(xiàn)的功能。

Python如何爬取美劇隨時(shí)看

好了,我們的內(nèi)容成功獲取到了,然后自己下載吧!

程序擴(kuò)展

聰明的小伙伴一定想到了,還有很多好看的美劇呢,我們?nèi)绾蜗螺d其它的內(nèi)容呢?

如何下載其它視頻呢?

過程同上,先到主頁搜索,然后更改我們的url_list列表,執(zhí)行程序即可!接觸過前端的小伙伴肯定知道,每個(gè)網(wǎng)站的結(jié)構(gòu)基本是相同的,我們這樣的方法在天天看M劇的主頁上應(yīng)該是通用的。感興趣的小伙伴自己下載看看咯。

以上是Python如何爬取美劇隨時(shí)看的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道!

網(wǎng)頁標(biāo)題:Python如何爬取美劇隨時(shí)看-創(chuàng)新互聯(lián)
文章轉(zhuǎn)載:http://www.muchs.cn/article6/pccog.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、移動(dòng)網(wǎng)站建設(shè)標(biāo)簽優(yōu)化、動(dòng)態(tài)網(wǎng)站、響應(yīng)式網(wǎng)站、App開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)