搜索蜘蛛:什么是robots.txt,要怎么寫?

2023-06-01    分類: 網(wǎng)站建設(shè)

作為一名SEOer大家肯定是知道搜索蜘蛛的,但是關(guān)于robots.txt這個搜索蜘蛛遵循協(xié)議,卻鮮少有人談起,其實用好robots是很容易為你網(wǎng)站提權(quán)的,這里我不廢話了,直接說。

第一,用robots屏蔽網(wǎng)站重復頁

很多網(wǎng)站一個內(nèi)容提供多種瀏覽版本,雖然很方便用戶卻對蜘蛛造成了困難,因為它分不清那個是主,那個是次,一旦讓它認為你在惡意重復,兄弟你就慘了

User-agent: *

Disallow: /sitemap/ 《禁止蜘蛛抓取 文本網(wǎng)頁》

第二,用robots保護網(wǎng)站安全

很多人納悶了,robots怎么還和網(wǎng)站安全有關(guān)系了?其實關(guān)系還很大,不少低級黑客就是通過搜索默認后臺登陸,以達到入侵網(wǎng)站的目標

User-agent: *

Disallow: /admin/ 《禁止蜘蛛抓取admin目錄下所有文件》

第三,防止盜鏈

一般盜鏈也就幾個人,可是一旦被搜索引擎“盜鏈”那家伙你100M寬帶也吃不消,如果你做的不是圖片網(wǎng)站,又不想被搜索引擎“盜鏈”你的網(wǎng)站圖片

User-agent: *

Disallow: .jpg$

第四,提交網(wǎng)站地圖

現(xiàn)在做優(yōu)化的都知道做網(wǎng)站地圖了,可是卻沒幾個會提交的,絕大多數(shù)人是干脆在網(wǎng)頁上加個鏈接,其實robots是支持這個功能的

Sitemap: http://www.01netcn.com/sitemap.xml

第五,禁止某二級域名的抓取

一些網(wǎng)站會對VIP會員提供一些特殊服務,卻又不想這個服務被搜索引擎檢索到

User-agent: *

Disallow: /

本文題目:搜索蜘蛛:什么是robots.txt,要怎么寫?
分享URL:http://www.muchs.cn/news45/261945.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供營銷型網(wǎng)站建設(shè)、面包屑導航外貿(mào)建站、動態(tài)網(wǎng)站、網(wǎng)站維護響應式網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護公司