易優(yōu)cms火車頭采集 火車頭采集https

火車頭采集器怎么采集今日頭條文章?

第一步采集網(wǎng)址,下載好火車頭采集器后打開,新建一個任務(wù),任務(wù)名隨意。把需要采集的網(wǎng)站文章列表頁網(wǎng)址添加到起始網(wǎng)址。從圖中看出該列表頁有34頁,每頁有N篇文章。

在海鹽等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站設(shè)計、成都網(wǎng)站制作 網(wǎng)站設(shè)計制作定制設(shè)計,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站建設(shè),網(wǎng)絡(luò)營銷推廣,外貿(mào)網(wǎng)站制作,海鹽網(wǎng)站建設(shè)費用合理。

2

列表頁會一級網(wǎng)址,添加多級網(wǎng)址獲取,從而獲取二級網(wǎng)址(文章頁網(wǎng)址)

設(shè)置列表分頁獲取,3個地方分別是:分頁源代碼前面和后面還有中間位置。這一步用于獲取列表頁面鏈接,因為有34個列表頁面。設(shè)置完保存。

網(wǎng)址獲取選項,這一步用于獲取列表頁上面文章頁的鏈接,根據(jù)自己需要設(shè)置需要截取的部分和根據(jù)網(wǎng)址的結(jié)構(gòu)設(shè)置包含與不包含某些字符。為空即沒限制,設(shè)置完保存。

設(shè)置好鏈接采集規(guī)則后,可以測試網(wǎng)址,看測試結(jié)果調(diào)整規(guī)則??磮D可以看到采集鏈接規(guī)則從起始鏈接到全面列表頁再到列表頁上的文章頁鏈接都已經(jīng)成功采集。

第二步是采集內(nèi)容,首先修改標題規(guī)則,在頁面源代碼里面找到標題的代碼,把標題前后代碼負責(zé)過去截取出標題。保存。

修改內(nèi)容采集規(guī)則,跟標題規(guī)則差不多,也是源代碼里面找到內(nèi)容的前后代碼。這里內(nèi)容會有一些其他html標簽,所以得添加一個html標簽排除的規(guī)則。

完成后,測試看一下結(jié)果,從測試結(jié)果來調(diào)試規(guī)則,直到測試結(jié)果是自己想要的內(nèi)容為止。

第三步是采集導(dǎo)出。前面1、2兩步把規(guī)則設(shè)置好,最后就要把文章導(dǎo)出了。先做一個導(dǎo)出的模版。

然后選擇方式二,把每一篇文章都分別記錄到一個txt文本,保存位置自己選擇,模板選擇剛剛做好的導(dǎo)出模版.保存的文件名用文章標題為命名。其他默認,保存。

把采集網(wǎng)址,采集內(nèi)容,發(fā)布3個選項框都勾選,然后開始采集。完成后文本就自動生成在剛剛保存的文件夾里面了。

火車頭采集器采集文章教程到此就完成了,由于每個網(wǎng)站都是不一樣的,所以這里只能用一個網(wǎng)站演示,只是一個方法思路,自己采集文章還需要靈活變通。

易優(yōu)cms怎么安裝產(chǎn)品采集插件

1、在易優(yōu)CMS官網(wǎng)上下載安裝文件。

2、將下載的安裝文件復(fù)制到服務(wù)器根目錄下,執(zhí)行安裝程序。

3、安裝完成后,進入易優(yōu)CMS后臺,在“插件管理”中激活產(chǎn)品采集插件,即可使用。

火車頭如何采集還有縮略圖的文章呢

1、首先在采集列表頁的源碼中將帶有縮略圖的那部分源碼復(fù)制下來,如圖:

2、查看網(wǎng)站的源碼,找到這行代碼,如圖:

3、打開火車頭,進入采集網(wǎng)址規(guī)則—添加多級網(wǎng)址采集規(guī)則,選中手動填寫鏈接地址規(guī)則,并將第二步驟中選中的代碼粘貼進去,如圖:

4、將代碼進行如下修改:

5、改好后保存并進行采集測試,如圖所示

6、然后再在采集內(nèi)容規(guī)則里進行修改,選中“縮略圖”標簽,打開,進行內(nèi)容替換,如圖:

7、然后點擊文件下載,選中下載圖片,并填好縮略圖保存路徑及命名方式,如圖:

8、在“文件保存及部分高級設(shè)置”里設(shè)定縮略圖的保存盤符及其前綴,我設(shè)定為桌面,前綴為“./”,如圖:

9、我們保存后測試一下,一起順利,縮略圖順利采集下來了

本文題目:易優(yōu)cms火車頭采集 火車頭采集https
文章源于:http://muchs.cn/article2/doesoic.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)、App開發(fā)品牌網(wǎng)站建設(shè)、微信小程序用戶體驗、微信公眾號

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作