爬蟲利器Puppeteer實(shí)戰(zhàn)-創(chuàng)新互聯(lián)

Puppeteer 介紹

創(chuàng)新互聯(lián)公司一直通過網(wǎng)站建設(shè)和網(wǎng)站營銷幫助企業(yè)獲得更多客戶資源。 以"深度挖掘,量身打造,注重實(shí)效"的一站式服務(wù),以成都做網(wǎng)站、網(wǎng)站建設(shè)、移動互聯(lián)產(chǎn)品、成都全網(wǎng)營銷推廣服務(wù)為核心業(yè)務(wù)。10余年網(wǎng)站制作的經(jīng)驗(yàn),使用新網(wǎng)站建設(shè)技術(shù),全新開發(fā)出的標(biāo)準(zhǔn)網(wǎng)站,不但價(jià)格便宜而且實(shí)用、靈活,特別適合中小公司網(wǎng)站制作。網(wǎng)站管理系統(tǒng)簡單易用,維護(hù)方便,您可以完全操作網(wǎng)站資料,是中小公司快速網(wǎng)站建設(shè)的選擇。

Puppeteer 翻譯是操縱木偶的人,利用這個(gè)工具,我們能做一個(gè)操縱頁面的人。 Puppeteer 是一個(gè) Nodejs 的庫,支持調(diào)用 Chrome的API來操縱Web ,相比較 Selenium 或是 PhantomJs ,它大的特點(diǎn)就是它的操作 Dom 可以完全在內(nèi)存中進(jìn)行模擬既在 V8 引擎中處理而不打開瀏覽器,而且關(guān)鍵是這個(gè)是Chrome團(tuán)隊(duì)在維護(hù),會擁有更好的兼容性和前景。

Puppeteer 用處

  • 利用網(wǎng)頁生成PDF、圖片
  • 爬取SPA應(yīng)用,并生成預(yù)渲染內(nèi)容(即“SSR” 服務(wù)端渲染)
  • 可以從網(wǎng)站抓取內(nèi)容
  • 自動化表單提交、UI測試、鍵盤輸入等
  • 幫你創(chuàng)建一個(gè)最新的自動化測試環(huán)境(chrome),可以直接在此運(yùn)行測試用例6.捕獲站點(diǎn)的時(shí)間線,以便追蹤你的網(wǎng)站,幫助分析網(wǎng)站性能問題

Puppeteer 使用

安裝 Puppeteer

由于封網(wǎng),直接下載 Chromium 會失敗,可以先阻止下載 Chromium 然后再手動下載它

# 安裝命令
npm i puppeteer --save

# 錯(cuò)誤信息
ERROR: Failed to download Chromium r515411! Set "PUPPETEER_SKIP_CHROMIUM_DOWNLOAD" env variable to skip download.

# 設(shè)置環(huán)境變量跳過下載 Chromium
set PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1 

# 或者可以這樣干,只下載模塊而不build
npm i --save puppeteer --ignore-scripts

# 成功安裝模塊
+ puppeteer@0.13.0
added 1 package in 1.77s

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

新聞標(biāo)題:爬蟲利器Puppeteer實(shí)戰(zhàn)-創(chuàng)新互聯(lián)
轉(zhuǎn)載源于:http://muchs.cn/article18/dpcsdp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化Google、移動網(wǎng)站建設(shè)、全網(wǎng)營銷推廣網(wǎng)站內(nèi)鏈、虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司