如何巧用robots避免蜘蛛黑洞？

2021-02-03 分類：網(wǎng)站建設

如何巧用robots避免蜘蛛黑洞？

對于百度搜索引擎來說，蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多，及內容雷同但具體參數(shù)不同的動態(tài)URL ，就像一個無限循環(huán)的“黑洞”將spider困住，Baiduspider浪費了大量資源抓取的卻是無效網(wǎng)頁。

比如很多網(wǎng)站都有篩選功能，通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會被搜索引擎大量抓取，而這其中很大一部分檢索價值不高，如“500-1000之間價格的租房”，首先網(wǎng)站（包括現(xiàn)實中）上基本沒有相關資源，其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網(wǎng)頁被搜索引擎大量抓取，只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢？

我們以北京某團購網(wǎng)站為例，看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的：

對于普通的篩選結果頁，該網(wǎng)站選擇使用靜態(tài)鏈接，如：http://bj.XXXXX.com/category/zizhucan/weigongcun

同樣是條件篩選結果頁，當用戶選擇不同排序條件后，會生成帶有不同參數(shù)的動態(tài)鏈接，而且即使是同一種排序條件（如：都是按銷量降序排列），生成的參數(shù)也都是不同的。如：http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

對于該團購網(wǎng)來說，只讓搜索引擎抓取篩選結果頁就可以了，而各種帶參數(shù)的結果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。

robots.txt的文件用法中有這樣一條規(guī)則：Disallow: /*?* ，即禁止搜索引擎訪問網(wǎng)站中所有的動態(tài)頁面。該網(wǎng)站恰是通過這種方式，對Baiduspider優(yōu)先展示高質量頁面、屏蔽了低質量頁面，為Baiduspider提供了更友好的網(wǎng)站結構，避免了黑洞的形成。

新聞標題：如何巧用robots避免蜘蛛黑洞？
標題路徑：http://muchs.cn/news/98973.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供品牌網(wǎng)站設計、云服務器、虛擬主機、電子商務、全網(wǎng)營銷推廣、企業(yè)建站

聲明：本網(wǎng)站發(fā)布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經(jīng)允許不得轉載，或轉載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內容

適用于Vue開發(fā)人員的原型工具OverVue 2021-02-03
為什么程序員的業(yè)余項目大多都死了？ 2021-02-03
H5嵌入APP的聯(lián)合登錄 2021-02-03
教育培訓機構4個好用的招生營銷模式 2021-02-03
高DAU產(chǎn)品的6大運營絕招，輕松達成95%留存率！ 2021-02-03
新零售時代已來，助力社區(qū)商業(yè)實現(xiàn)智能化、數(shù)據(jù)化 2021-02-03
炒域名還有“錢”途嗎？ 2021-02-03
智能家居離不開云計算 2021-02-03

如何巧用robots避免蜘蛛黑洞？

如何巧用robots避免蜘蛛黑洞？