如何利用robots文件來進行SEO優(yōu)化

2015-08-03    分類: 網(wǎng)站建設(shè)

robots文件可限制抓取網(wǎng)頁的搜索引擎蜘蛛對您網(wǎng)站的訪問。這些蜘蛛是自動的,它們在訪問任意網(wǎng)站的網(wǎng)頁之前,都會查看是否存在阻止它們訪問特定網(wǎng)頁的robots.txt文件。簡單的說,就是在百度進來抓取的第一時間,告訴百度指數(shù)哪些東西是可以看的,哪些東西是不能看的。只有當(dāng)您的網(wǎng)站中包含您不想讓搜索引擎編入索引的內(nèi)容時,才需要使用robots.txt文件。Robots協(xié)議用來告知搜索引擎哪些頁面能被抓取,哪些頁面不能被抓??;可以屏蔽一些網(wǎng)站中比較大的文件,如:圖片,音樂,視頻等,節(jié)省服務(wù)器帶寬;可以屏蔽站點的一些死鏈接。方便搜索引擎抓取網(wǎng)站內(nèi)容;設(shè)置網(wǎng)站地圖連接,方便引導(dǎo)蜘蛛爬取頁面。下面創(chuàng)新互聯(lián)就來和大家說說如何利用robots文件來進行seo優(yōu)化。

robots文件寫法

User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個通配符

Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄

Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄

Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄

Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以".htm"為后綴的URL。

Disallow: /*?* 禁止訪問網(wǎng)站中所有包含問號 (?) 的網(wǎng)址

Disallow: /.jpg$ 禁止抓取網(wǎng)頁所有的.jpg格式的圖片

Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。

Allow: /cgi-bin/這里定義是允許爬尋cgi-bin目錄下面的目錄

Allow: /tmp 這里定義是允許爬尋tmp的整個目錄

Allow: .htm$ 僅允許訪問以".htm"為后綴的URL。

Allow: .gif$ 允許抓取網(wǎng)頁和gif格式圖片

Sitemap: 網(wǎng)站地圖 告訴爬蟲這個頁面是網(wǎng)站地圖

robots文件用法

例1. 禁止所有搜索引擎訪問網(wǎng)站的任何部分

User-agent: *

Disallow: /

實例分析:淘寶網(wǎng)的 Robots.txt文件

User-agent: Baidu百度蜘蛛

Disallow: /

User-agent: baidu百度蜘蛛

Disallow: /

當(dāng)前題目:如何利用robots文件來進行SEO優(yōu)化
鏈接URL:http://www.muchs.cn/news32/25782.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化、手機網(wǎng)站建設(shè)、網(wǎng)站改版定制網(wǎng)站、網(wǎng)站設(shè)計、網(wǎng)站策劃

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管