不清楚SEO爬行收集和索引?

2013-04-21    分類: 網(wǎng)站建設(shè)

你如何學(xué)習(xí)做SEO?第一步是什么?記得?你想買一本關(guān)于SEO的書,找出一開始會(huì)提到的基本概念,這會(huì)讓你感到困惑,想把它寫下來(lái),卻發(fā)現(xiàn)根本不懂?

大多數(shù)不想自己學(xué)習(xí)的人都會(huì)有這樣一個(gè)痛苦的開始。對(duì)于來(lái)智優(yōu)的新人,我們通常會(huì)安排他們從寫文章開始,先寫再談概念。在培訓(xùn)期間,他們還會(huì)多次提到這些概念和優(yōu)化技能。當(dāng)你再看一遍基本的書,你就會(huì)知道他們?cè)谡f什么,你會(huì)發(fā)現(xiàn)當(dāng)你在不同的階段讀同一本書時(shí),你會(huì)感覺完全不同。這就是“向過去學(xué)習(xí),向新學(xué)習(xí)”。

但在這期間,會(huì)有新球員不按常理打球。我想我可以運(yùn)用這些技巧。為什么我要理解這個(gè)概念?

原因很簡(jiǎn)單。概念是技能描述的概括和集中。其中一個(gè)或兩個(gè)字將代表一個(gè)操作?,F(xiàn)在你問身邊的優(yōu)化人員,什么是爬行?抓什么?指數(shù)是多少?包括什么?他能描述清楚嗎?

當(dāng)然,如果解釋不清楚,并不意味著他的優(yōu)化能力不好,但他的“產(chǎn)出”能力不好,也就是說,他不會(huì)總結(jié)??偨Y(jié)越精辟,他對(duì)企業(yè)的理解就越深刻。所以今天智友英嘉就帶大家來(lái)復(fù)習(xí)這些基本概念,希望能提醒初學(xué)者和沒有“輸出”概念的朋友們。

爬網(wǎng)是指搜索引擎蜘蛛從已知頁(yè)面解析鏈接的URL,然后沿鏈接查找新頁(yè)面(即鏈接的URL)的過程。當(dāng)然,蜘蛛不會(huì)立即爬過新的URL來(lái)獲取新頁(yè)面,而是將發(fā)現(xiàn)的URL存儲(chǔ)在要獲取的地址庫(kù)中。蜘蛛按照一定的順序從地址庫(kù)中提取要獲取的URL。

爬行是指搜索引擎蜘蛛從要抓取的地址庫(kù)中提取要抓取的URL,訪問URL,并將讀取的HTML代碼存儲(chǔ)在數(shù)據(jù)庫(kù)中。Spider的爬行是像瀏覽器一樣打開這個(gè)頁(yè)面,這將在服務(wù)器的原始日志中留下記錄,并允許用戶訪問瀏覽器。

索引是指對(duì)URL的信息進(jìn)行排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中,即索引庫(kù)中。當(dāng)用戶搜索時(shí),搜索引擎從索引庫(kù)中提取URL信息并按順序顯示。

從搜索引擎的角度來(lái)看,包含了URL,即該URL的信息存在于索引庫(kù)中。

也就是說,蜘蛛不訪問和抓取此頁(yè)面(例如,禁止通過robots文件抓?。隧?yè)面的索引庫(kù)中有信息,用戶搜索時(shí)可以看到這些信息。

例如,百度蜘蛛不允許用機(jī)器人文件抓取淘寶網(wǎng)的整個(gè)網(wǎng)站,但Noindex也不禁止索引,所以即使百度不訪問和抓取淘寶網(wǎng)的頁(yè)面,淘寶網(wǎng)的很多頁(yè)面都會(huì)被百度索引,用戶可以找到:

百度從互聯(lián)網(wǎng)上這么多的鏈接知道淘寶主頁(yè)的存在。通過鏈接的錨文本,它也知道這個(gè)頁(yè)面的標(biāo)題可能是淘寶等。當(dāng)然,它也知道百度口碑中的評(píng)價(jià)數(shù)字。所以即使百度蜘蛛沒有抓到淘寶的主頁(yè),用戶仍然可以找到它并顯示百度知道的一些信息。

百度怎么能不回淘寶首頁(yè)呢?刪除禁止獲取的robots文件,并使用頁(yè)面上的Noindex禁止索引。

最常見的情況是,如上所述,禁止使用Noindex對(duì)頁(yè)眉信息進(jìn)行索引,并對(duì)頁(yè)面進(jìn)行爬網(wǎng)。讀取Noindex之后,它將不會(huì)被索引,也不會(huì)在搜索結(jié)果中返回。向舊頁(yè)添加新的Noindex不會(huì)立即刪除索引,但它會(huì)保留索引一段時(shí)間,但不會(huì)返回搜索結(jié)果。

使用no index的頁(yè)面上的鏈接可以被跟蹤一段時(shí)間,但經(jīng)過很長(zhǎng)時(shí)間后,使用Noindex的頁(yè)面搜索引擎可能不再抓取和索引,上面的鏈接將無(wú)效。

網(wǎng)頁(yè)內(nèi)容也有可能被抄襲、轉(zhuǎn)載,質(zhì)量不高。盡管搜索引擎會(huì)抓取頁(yè)面,但它會(huì)在索引過程中檢測(cè)到這些內(nèi)容問題,這些問題會(huì)被丟棄而不會(huì)被索引。因此,如果沒有包含頁(yè)面,通常需要先檢查原始日志,看看是否已捕獲。如果已捕獲,則可能是內(nèi)容質(zhì)量問題。如果根本沒有捕獲,建議首先查看網(wǎng)站結(jié)構(gòu)是否有問題。

網(wǎng)站欄目:不清楚SEO爬行收集和索引?
本文鏈接:http://www.muchs.cn/news/448.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作網(wǎng)站制作、面包屑導(dǎo)航、品牌網(wǎng)站建設(shè)、外貿(mào)建站、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都seo排名網(wǎng)站優(yōu)化

網(wǎng)站建設(shè)知識(shí)