網(wǎng)站結(jié)構(gòu)合理的重要性

2016-11-04    分類: 網(wǎng)站建設(shè)

搜索引擎都有自己的“搜索機(jī)器人”(ROBOTS),并通過這些ROBOTS在網(wǎng)絡(luò)上沿著網(wǎng)頁上的鏈接(一般是http和src鏈接)不斷抓取資料建立自己的數(shù)據(jù)庫。 對(duì)于網(wǎng)站管理者和內(nèi)容提供者來說,有時(shí)候會(huì)有一些站點(diǎn)內(nèi)容,不希望被ROBOTS抓取而公開。為了解決這個(gè)問題,ROBOTS開發(fā)界提供了兩個(gè)辦法:一個(gè)是robots.txt,另一個(gè)是The Robots META標(biāo)簽。
一、robots.txt 1、什么是robots.txt? robots.txt是一個(gè)純文本文件,通過在這個(gè)文件中聲明該網(wǎng)站中不想被robots訪問的部分,這樣,該網(wǎng)站的部分或全部?jī)?nèi)容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內(nèi)容。 當(dāng)一個(gè)搜索機(jī)器人訪問一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果找到,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍,如果該文件不存在,那么搜索機(jī)器人就沿著鏈接抓取。 robots.txt必須放置在一個(gè)站點(diǎn)的根目錄下,而且文件名必須全部小寫。 網(wǎng)站 URL 相應(yīng)的 robots.txt的 URL http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt
2、robots.txt的語法 "robots.txt"文件包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示: ":"。 在該文件中可以使用#進(jìn)行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow行,詳細(xì)情況如下: User-agent: 該項(xiàng)的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多條User-agent記錄說明有多個(gè)robot會(huì)受到該協(xié)議的限制,對(duì)該文件來說,至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*,則該協(xié)議對(duì)任何機(jī)器人均有效,在"robots.txt"文件中, "User-agent:*"這樣的記錄只能有一條。 Disallow : 該項(xiàng)的值用于描述不希望被訪問到的一個(gè)URL,這個(gè)URL可以是一條完整的路徑,也可以是部分的,任何以Disallow 開頭的URL均不會(huì)被robot訪問到。例如"Disallow: /help"對(duì)/help.html 和/help/index.html都不允許搜索引擎訪問,而"Disallow: /help/"則允許robot訪問/help.html,而不能訪問/help/index.html。 任何一條Disallow記錄為空,說明該網(wǎng)站的所有部網(wǎng)站建設(shè)中遇到的問題,以及“Web標(biāo)準(zhǔn)”思想的產(chǎn)生、發(fā)展和推廣。讓你明白為什么要采用和推廣Web 標(biāo)準(zhǔn)。
第二部分從技術(shù)細(xì)節(jié)上講解了網(wǎng)站實(shí)際制作開發(fā)過程中如何向Web標(biāo)準(zhǔn)過渡,如何采用和符合Web標(biāo)準(zhǔn)。通過閱讀本書,你可以清楚一些基本問題: Web標(biāo)準(zhǔn)是什么? 網(wǎng)站一定要用標(biāo)準(zhǔn)嗎? 用標(biāo)準(zhǔn)和不用標(biāo)準(zhǔn)的區(qū)別? 如何采用標(biāo)準(zhǔn)? 如何向標(biāo)準(zhǔn)過渡? 適合什么樣的人看這本書適合的讀者是:所有的網(wǎng)站設(shè)計(jì)者、開發(fā)者和所有者。 這不是廣告詞。不論對(duì)這一行業(yè)的新手還是資深人士,本書都將對(duì)你產(chǎn)生深刻影響。它告訴我們?cè)鯓幼鍪钦_的,以及應(yīng)該如何做。也許本書介紹的思想和技術(shù)你可能不會(huì)馬上接受或貫徹到工作中,但它是Web發(fā)展的趨勢(shì),是阻擋不了的發(fā)展趨勢(shì)。它的重要性已經(jīng)并將繼續(xù)在Web領(lǐng)域體現(xiàn)。 對(duì)我們有什么好處如果你是Web設(shè)計(jì)師、開發(fā)者或所有者,如果你正在困惑自己應(yīng)該學(xué)習(xí)什么,怎么做,如果你正在猶豫自己網(wǎng)站的發(fā)展方向,如果你正在想如何把自己提高一個(gè)層次,如果你正在頭疼不斷的網(wǎng)站升級(jí)問題,本書正是你需要的! 它告訴你Web開發(fā)的技術(shù)將如何發(fā)展,未來的Web將是怎樣的??辞宄诉@些,如何發(fā)展網(wǎng)站,自己如何定位就容易得多。
任何書都有它的價(jià)值所在。如果需要一個(gè)理由購(gòu)買這本書,那么我會(huì)這樣說:你可以不買這本書,但是本書的思想和技術(shù)你一定要了解,總有一天你會(huì)需要它,這一點(diǎn)是百分之百肯定的。與其被動(dòng)地、等到迫不得已的時(shí)候再來了解和學(xué)習(xí),為什么不現(xiàn)在就行動(dòng)? 譯者的感受對(duì)于本書的作者Jeffrey Zeldman,國(guó)內(nèi)設(shè)計(jì)師和開發(fā)者可能并不熟悉,但在國(guó)外,同行無人不知。他領(lǐng)導(dǎo)的Web標(biāo)準(zhǔn)組織(www.Webstandards.org)幫助終止了Microso ft 與Netscape之間的瀏覽器之戰(zhàn),使得我們不再需要考慮瀏覽器不同版本問題。他也是資深的設(shè)計(jì)師,對(duì)網(wǎng)站技術(shù)的歷史和發(fā)展了如指掌。通過翻譯本書,我們對(duì)Web標(biāo)準(zhǔn)的發(fā)展歷史、Web標(biāo)準(zhǔn)技術(shù)的應(yīng)用進(jìn)行了系統(tǒng)而全面的了解。特別是許多技術(shù)細(xì)節(jié)的來龍去脈,常常讓我們頓悟:原來如此! 本書不像Flash或者Photoshop教程那么有趣,也不像程序語言教材那樣立竿見影,但我們還是決定翻 Disallow: /cgi-bin/

本文題目:網(wǎng)站結(jié)構(gòu)合理的重要性
分享鏈接:http://muchs.cn/news/59364.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、網(wǎng)站導(dǎo)航網(wǎng)站排名、面包屑導(dǎo)航、定制網(wǎng)站、虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計(jì)公司