微信小程序之如何解析網(wǎng)頁(yè)內(nèi)容

這篇文章將為大家詳細(xì)講解有關(guān)微信小程序之如何解析網(wǎng)頁(yè)內(nèi)容,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比臨渭區(qū)網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式臨渭區(qū)網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋臨渭區(qū)地區(qū)。費(fèi)用合理售后完善,10年實(shí)體公司更值得信賴。

微信小程序 解析網(wǎng)頁(yè)內(nèi)容詳解

最近在寫一個(gè)爬蟲,需要將網(wǎng)頁(yè)進(jìn)行解析供微信小程序使用。文字和圖片解析都好說(shuō),小程序也有對(duì)應(yīng)的text和image標(biāo)簽可以呈現(xiàn)。而更復(fù)雜的,比如表格,則比較棘手,不管是服務(wù)端解析還是小程序呈現(xiàn)都很費(fèi)勁,也很難覆蓋所有情況。于是我想,將表格對(duì)應(yīng)的HTML代碼轉(zhuǎn)成圖片,不失為一種變通的方法。

這里我們采用node-webshot模塊,它對(duì)PhantomJS進(jìn)行了輕量封裝,可以輕松地將網(wǎng)頁(yè)以截圖形式保存下來(lái)。

首先安裝Node.js和PhantomJS,然后新建一個(gè)js文件,加載node-webshot模塊:

const webshot = require('webshot');

定義選項(xiàng):

const options = {
  // 瀏覽器窗口
  screenSize: {
    width: 755,
    height: 25
  },
  // 要截圖的頁(yè)面文檔區(qū)域
  shotSize: {
    height: 'all'
  },
  // 網(wǎng)頁(yè)類型
  siteType: 'html'
};

這里,瀏覽器窗口的寬度要根據(jù)網(wǎng)頁(yè)情況合理設(shè)置,高度可以設(shè)置為一個(gè)很小的數(shù)值,然后頁(yè)面文檔區(qū)域的高度一定要設(shè)置為all,寬度默認(rèn)為窗口寬度,這樣就可以把表格以最小的尺寸完整截圖。

接下來(lái),定義html字符串:

let html = "target rich text html code, eg: <table>...</table>";

注意,里面的HTML代碼一定要去掉換行符,并將雙引號(hào)替換為單引號(hào)。

最后,截圖:

webshot(html, 'demo.png', options, (err) => {
  if (err)
    console.log(`Webshot error: ${err.message}`);
});

關(guān)于“微信小程序之如何解析網(wǎng)頁(yè)內(nèi)容”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

本文名稱:微信小程序之如何解析網(wǎng)頁(yè)內(nèi)容
本文URL:http://www.muchs.cn/article14/ghogge.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營(yíng)銷推廣、云服務(wù)器、網(wǎng)站維護(hù)、虛擬主機(jī)、標(biāo)簽優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)