不清楚SEO爬行收集和索引?

2013-04-21    分類: 網(wǎng)站建設(shè)

你如何學習做SEO?第一步是什么?記得?你想買一本關(guān)于SEO的書,找出一開始會提到的基本概念,這會讓你感到困惑,想把它寫下來,卻發(fā)現(xiàn)根本不懂?

大多數(shù)不想自己學習的人都會有這樣一個痛苦的開始。對于來智優(yōu)的新人,我們通常會安排他們從寫文章開始,先寫再談概念。在培訓期間,他們還會多次提到這些概念和優(yōu)化技能。當你再看一遍基本的書,你就會知道他們在說什么,你會發(fā)現(xiàn)當你在不同的階段讀同一本書時,你會感覺完全不同。這就是“向過去學習,向新學習”。

但在這期間,會有新球員不按常理打球。我想我可以運用這些技巧。為什么我要理解這個概念?

原因很簡單。概念是技能描述的概括和集中。其中一個或兩個字將代表一個操作?,F(xiàn)在你問身邊的優(yōu)化人員,什么是爬行?抓什么?指數(shù)是多少?包括什么?他能描述清楚嗎?

當然,如果解釋不清楚,并不意味著他的優(yōu)化能力不好,但他的“產(chǎn)出”能力不好,也就是說,他不會總結(jié)??偨Y(jié)越精辟,他對企業(yè)的理解就越深刻。所以今天智友英嘉就帶大家來復習這些基本概念,希望能提醒初學者和沒有“輸出”概念的朋友們。

爬網(wǎng)是指搜索引擎蜘蛛從已知頁面解析鏈接的URL,然后沿鏈接查找新頁面(即鏈接的URL)的過程。當然,蜘蛛不會立即爬過新的URL來獲取新頁面,而是將發(fā)現(xiàn)的URL存儲在要獲取的地址庫中。蜘蛛按照一定的順序從地址庫中提取要獲取的URL。

爬行是指搜索引擎蜘蛛從要抓取的地址庫中提取要抓取的URL,訪問URL,并將讀取的HTML代碼存儲在數(shù)據(jù)庫中。Spider的爬行是像瀏覽器一樣打開這個頁面,這將在服務(wù)器的原始日志中留下記錄,并允許用戶訪問瀏覽器。

索引是指對URL的信息進行排序并存儲到數(shù)據(jù)庫中,即索引庫中。當用戶搜索時,搜索引擎從索引庫中提取URL信息并按順序顯示。

從搜索引擎的角度來看,包含了URL,即該URL的信息存在于索引庫中。

也就是說,蜘蛛不訪問和抓取此頁面(例如,禁止通過robots文件抓?。?,但此頁面的索引庫中有信息,用戶搜索時可以看到這些信息。

例如,百度蜘蛛不允許用機器人文件抓取淘寶網(wǎng)的整個網(wǎng)站,但Noindex也不禁止索引,所以即使百度不訪問和抓取淘寶網(wǎng)的頁面,淘寶網(wǎng)的很多頁面都會被百度索引,用戶可以找到:

百度從互聯(lián)網(wǎng)上這么多的鏈接知道淘寶主頁的存在。通過鏈接的錨文本,它也知道這個頁面的標題可能是淘寶等。當然,它也知道百度口碑中的評價數(shù)字。所以即使百度蜘蛛沒有抓到淘寶的主頁,用戶仍然可以找到它并顯示百度知道的一些信息。

百度怎么能不回淘寶首頁呢?刪除禁止獲取的robots文件,并使用頁面上的Noindex禁止索引。

最常見的情況是,如上所述,禁止使用Noindex對頁眉信息進行索引,并對頁面進行爬網(wǎng)。讀取Noindex之后,它將不會被索引,也不會在搜索結(jié)果中返回。向舊頁添加新的Noindex不會立即刪除索引,但它會保留索引一段時間,但不會返回搜索結(jié)果。

使用no index的頁面上的鏈接可以被跟蹤一段時間,但經(jīng)過很長時間后,使用Noindex的頁面搜索引擎可能不再抓取和索引,上面的鏈接將無效。

網(wǎng)頁內(nèi)容也有可能被抄襲、轉(zhuǎn)載,質(zhì)量不高。盡管搜索引擎會抓取頁面,但它會在索引過程中檢測到這些內(nèi)容問題,這些問題會被丟棄而不會被索引。因此,如果沒有包含頁面,通常需要先檢查原始日志,看看是否已捕獲。如果已捕獲,則可能是內(nèi)容質(zhì)量問題。如果根本沒有捕獲,建議首先查看網(wǎng)站結(jié)構(gòu)是否有問題。

網(wǎng)站標題:不清楚SEO爬行收集和索引?
網(wǎng)站網(wǎng)址:http://www.muchs.cn/news48/448.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計、關(guān)鍵詞優(yōu)化、網(wǎng)站建設(shè)、云服務(wù)器網(wǎng)站導航、App開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)

網(wǎng)站建設(shè)知識