不清楚SEO爬行收集和索引？

2013-04-21 分類：網(wǎng)站建設(shè)

你如何學(xué)習(xí)做SEO？第一步是什么？記得？你想買一本關(guān)于SEO的書，找出一開始會(huì)提到的基本概念，這會(huì)讓你感到困惑，想把它寫下來(lái)，卻發(fā)現(xiàn)根本不懂？

大多數(shù)不想自己學(xué)習(xí)的人都會(huì)有這樣一個(gè)痛苦的開始。對(duì)于來(lái)智優(yōu)的新人，我們通常會(huì)安排他們從寫文章開始，先寫再談概念。在培訓(xùn)期間，他們還會(huì)多次提到這些概念和優(yōu)化技能。當(dāng)你再看一遍基本的書，你就會(huì)知道他們?cè)谡f什么，你會(huì)發(fā)現(xiàn)當(dāng)你在不同的階段讀同一本書時(shí)，你會(huì)感覺完全不同。這就是“向過去學(xué)習(xí)，向新學(xué)習(xí)”。

但在這期間，會(huì)有新球員不按常理打球。我想我可以運(yùn)用這些技巧。為什么我要理解這個(gè)概念？

原因很簡(jiǎn)單。概念是技能描述的概括和集中。其中一個(gè)或兩個(gè)字將代表一個(gè)操作?，F(xiàn)在你問身邊的優(yōu)化人員，什么是爬行？抓什么？指數(shù)是多少？包括什么？他能描述清楚嗎？

當(dāng)然，如果解釋不清楚，并不意味著他的優(yōu)化能力不好，但他的“產(chǎn)出”能力不好，也就是說，他不會(huì)總結(jié)?？偨Y(jié)越精辟，他對(duì)企業(yè)的理解就越深刻。所以今天智友英嘉就帶大家來(lái)復(fù)習(xí)這些基本概念，希望能提醒初學(xué)者和沒有“輸出”概念的朋友們。

爬網(wǎng)是指搜索引擎蜘蛛從已知頁(yè)面解析鏈接的URL，然后沿鏈接查找新頁(yè)面（即鏈接的URL）的過程。當(dāng)然，蜘蛛不會(huì)立即爬過新的URL來(lái)獲取新頁(yè)面，而是將發(fā)現(xiàn)的URL存儲(chǔ)在要獲取的地址庫(kù)中。蜘蛛按照一定的順序從地址庫(kù)中提取要獲取的URL。

爬行是指搜索引擎蜘蛛從要抓取的地址庫(kù)中提取要抓取的URL，訪問URL，并將讀取的HTML代碼存儲(chǔ)在數(shù)據(jù)庫(kù)中。Spider的爬行是像瀏覽器一樣打開這個(gè)頁(yè)面，這將在服務(wù)器的原始日志中留下記錄，并允許用戶訪問瀏覽器。

索引是指對(duì)URL的信息進(jìn)行排序并存儲(chǔ)到數(shù)據(jù)庫(kù)中，即索引庫(kù)中。當(dāng)用戶搜索時(shí)，搜索引擎從索引庫(kù)中提取URL信息并按順序顯示。

從搜索引擎的角度來(lái)看，包含了URL，即該URL的信息存在于索引庫(kù)中。

也就是說，蜘蛛不訪問和抓取此頁(yè)面（例如，禁止通過robots文件抓?。隧?yè)面的索引庫(kù)中有信息，用戶搜索時(shí)可以看到這些信息。

例如，百度蜘蛛不允許用機(jī)器人文件抓取淘寶網(wǎng)的整個(gè)網(wǎng)站，但Noindex也不禁止索引，所以即使百度不訪問和抓取淘寶網(wǎng)的頁(yè)面，淘寶網(wǎng)的很多頁(yè)面都會(huì)被百度索引，用戶可以找到：

百度從互聯(lián)網(wǎng)上這么多的鏈接知道淘寶主頁(yè)的存在。通過鏈接的錨文本，它也知道這個(gè)頁(yè)面的標(biāo)題可能是淘寶等。當(dāng)然，它也知道百度口碑中的評(píng)價(jià)數(shù)字。所以即使百度蜘蛛沒有抓到淘寶的主頁(yè)，用戶仍然可以找到它并顯示百度知道的一些信息。

百度怎么能不回淘寶首頁(yè)呢？刪除禁止獲取的robots文件，并使用頁(yè)面上的Noindex禁止索引。

最常見的情況是，如上所述，禁止使用Noindex對(duì)頁(yè)眉信息進(jìn)行索引，并對(duì)頁(yè)面進(jìn)行爬網(wǎng)。讀取Noindex之后，它將不會(huì)被索引，也不會(huì)在搜索結(jié)果中返回。向舊頁(yè)添加新的Noindex不會(huì)立即刪除索引，但它會(huì)保留索引一段時(shí)間，但不會(huì)返回搜索結(jié)果。

使用no index的頁(yè)面上的鏈接可以被跟蹤一段時(shí)間，但經(jīng)過很長(zhǎng)時(shí)間后，使用Noindex的頁(yè)面搜索引擎可能不再抓取和索引，上面的鏈接將無(wú)效。

網(wǎng)頁(yè)內(nèi)容也有可能被抄襲、轉(zhuǎn)載，質(zhì)量不高。盡管搜索引擎會(huì)抓取頁(yè)面，但它會(huì)在索引過程中檢測(cè)到這些內(nèi)容問題，這些問題會(huì)被丟棄而不會(huì)被索引。因此，如果沒有包含頁(yè)面，通常需要先檢查原始日志，看看是否已捕獲。如果已捕獲，則可能是內(nèi)容質(zhì)量問題。如果根本沒有捕獲，建議首先查看網(wǎng)站結(jié)構(gòu)是否有問題。

網(wǎng)站欄目：不清楚SEO爬行收集和索引？
本文鏈接：http://www.muchs.cn/news/448.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供企業(yè)網(wǎng)站制作、網(wǎng)站制作、面包屑導(dǎo)航、品牌網(wǎng)站建設(shè)、外貿(mào)建站、企業(yè)建站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容