Python實現(xiàn)JS解密并爬取網(wǎng)站-創(chuàng)新互聯(lián)

Python實現(xiàn)JS解密并爬取網(wǎng)站?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

創(chuàng)新互聯(lián)公司 - 雅安移動機房,四川服務器租用,成都服務器租用,四川網(wǎng)通托管,綿陽服務器托管,德陽服務器托管,遂寧服務器托管,綿陽服務器托管,四川云主機,成都云主機,西南云主機,雅安移動機房,西南服務器托管,四川/成都大帶寬,成都機柜租用,四川老牌IDC服務商

打開開發(fā)者工具

Python實現(xiàn)JS解密并爬取網(wǎng)站

選擇XHR標簽頁,沒有找到什么

再查看一下這些圖片的URL值

http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp

嘗試搜索圖片元素

Python實現(xiàn)JS解密并爬取網(wǎng)站Python實現(xiàn)JS解密并爬取網(wǎng)站

發(fā)現(xiàn)有一個js文件,打開搜索

Python實現(xiàn)JS解密并爬取網(wǎng)站

發(fā)現(xiàn)這里有一個疑點,這不是html里面的字段嗎,那么 “i.getPicUrl(e)” 不就是那個圖片的URL的值了嗎

在這里下一個斷點,走你

Python實現(xiàn)JS解密并爬取網(wǎng)站

果然,這個就那個圖片URL生成的切入點,現(xiàn)在就是看調用棧,找到這個函數(shù)的起點,點擊右側的 ”e.init“,這里有一個setInitData函數(shù),從名字來看,應該就是設置初始數(shù)據(jù)的地方,在這里下一個斷點,進去看看

Python實現(xiàn)JS解密并爬取網(wǎng)站

這里有一個this.imgpath,這個應該就是圖片的URL值了,點擊F10,再單步調式,來到了charcode函數(shù)

Python實現(xiàn)JS解密并爬取網(wǎng)站

進去看看,這里應該就是加密函數(shù)了

Python實現(xiàn)JS解密并爬取網(wǎng)站

這里一步步調式,不要著急,來到了這里

Python實現(xiàn)JS解密并爬取網(wǎng)站

繼續(xù)單步調式,在第二次打開這么VM文件的時候,”__cr.imgpath“這個看起來很熟悉呀

Plain Text
"L-:N-M>-A>-A&#63;-M&#63;-I8-J<-M@-@J-@L-M&#63;-IA-JA-M>-@J-@>-M=-@@-@>-M&#63;-@A-@@-:N:8-M@-IN-AL-:N"

打開頁面源代碼,就在這里啦,不僅僅有圖片的URL加密值,還有其他數(shù)據(jù),這些都是在后面圖片URL拼接需要使用到的

Python實現(xiàn)JS解密并爬取網(wǎng)站

現(xiàn)在我們再重新看看那個加密函數(shù),它無非就是遍歷那個加密值的每個字符,獲取其Unicode值,再與__cr.chapter_id進行相關運算,然后再得到的Unicode數(shù)值返回字符

現(xiàn)在我們可以用python仿寫這個算法

Python實現(xiàn)JS解密并爬取網(wǎng)站

接下就是平常get請求獲取必要的數(shù)據(jù)了,通過正則獲取元素,拼接,以下是源碼

Python實現(xiàn)JS解密并爬取網(wǎng)站 看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注創(chuàng)新互聯(lián)-成都網(wǎng)站建設公司行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。

新聞標題:Python實現(xiàn)JS解密并爬取網(wǎng)站-創(chuàng)新互聯(lián)
文章出自:http://muchs.cn/article48/dpeeep.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設計公司、搜索引擎優(yōu)化、網(wǎng)站改版、品牌網(wǎng)站建設、面包屑導航服務器托管

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

成都app開發(fā)公司