昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么?

2022-08-07    分類: 網(wǎng)站建設(shè)

昆明網(wǎng)站建設(shè)的客戶在網(wǎng)站做完以后都會(huì)自己來(lái)研究SEO,在SEO領(lǐng)域會(huì)有一些專業(yè)術(shù)語(yǔ),比如說(shuō)爬行、抓取、索引、收錄等等,那么這些詞語(yǔ)是什么意思呢?小編來(lái)給大家解答。
索引
索引指的是將一個(gè)URL的信息進(jìn)行整理,存入數(shù)據(jù)庫(kù),也就是索引庫(kù),用戶搜索時(shí),搜索引擎從索引庫(kù)中提取URL信息并排序展現(xiàn)出來(lái)。索引的英文是index。索引庫(kù)是用于搜索的,所以被索引的URL是可以被用戶搜索到的,沒(méi)有被索引的URL用戶在搜索結(jié)果中是看不到的。
要注意的是,所謂“一個(gè)URL的信息“,并不限于蜘蛛從URL上抓取來(lái)的內(nèi)容,還有來(lái)自其它來(lái)源的信息,如外部鏈接、鏈接的錨文字等。有的時(shí)候,索引庫(kù)中關(guān)于這個(gè)URL的的信息,根本沒(méi)有從這個(gè)URL抓取來(lái)的內(nèi)容,但搜索引擎知道這個(gè)URL的存在,并且有一些其它信息。
抓取和索引不是一回事。
爬行
爬行指的是搜索引擎蜘蛛從已知頁(yè)面上解析出鏈接指向的URL,然后沿著鏈接發(fā)現(xiàn)新頁(yè)面(也就是鏈接指向的URL)的過(guò)程。當(dāng)然,蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬過(guò)去抓取新頁(yè)面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫(kù)中,蜘蛛按照一定順序從地址庫(kù)中提取要抓取的URL。
收錄
我個(gè)人覺(jué)得收錄和索引沒(méi)有區(qū)別。只不過(guò)收錄是從搜索用戶角度看的,搜索時(shí)能找到這個(gè)URL,就是這個(gè)URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個(gè)URL的信息在索引庫(kù)中存在。英文并沒(méi)有收錄這個(gè)詞,和索引用的是同一個(gè)詞index。
抓取
抓取是搜索引擎蜘蛛從待抓地址庫(kù)中提取要抓的URL,訪問(wèn)這個(gè)URL,把讀取的HTML代碼存入數(shù)據(jù)庫(kù)。蜘蛛的抓取就是像瀏覽器一樣打開這個(gè)頁(yè)面,和用戶瀏覽器訪問(wèn)一樣,也會(huì)在服務(wù)器原始日志中留下記錄。

網(wǎng)站題目:昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么?
文章鏈接:http://www.muchs.cn/news25/186725.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護(hù)、域名注冊(cè)企業(yè)建站、網(wǎng)頁(yè)設(shè)計(jì)公司定制開發(fā)、網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁(yè)設(shè)計(jì)