昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么？

2022-08-07 分類：網(wǎng)站建設(shè)

昆明網(wǎng)站建設(shè)的客戶在網(wǎng)站做完以后都會(huì)自己來(lái)研究SEO，在SEO領(lǐng)域會(huì)有一些專業(yè)術(shù)語(yǔ)，比如說(shuō)爬行、抓取、索引、收錄等等，那么這些詞語(yǔ)是什么意思呢？小編來(lái)給大家解答。
索引
索引指的是將一個(gè)URL的信息進(jìn)行整理，存入數(shù)據(jù)庫(kù)，也就是索引庫(kù)，用戶搜索時(shí)，搜索引擎從索引庫(kù)中提取URL信息并排序展現(xiàn)出來(lái)。索引的英文是index。索引庫(kù)是用于搜索的，所以被索引的URL是可以被用戶搜索到的，沒(méi)有被索引的URL用戶在搜索結(jié)果中是看不到的。
要注意的是，所謂“一個(gè)URL的信息“，并不限于蜘蛛從URL上抓取來(lái)的內(nèi)容，還有來(lái)自其它來(lái)源的信息，如外部鏈接、鏈接的錨文字等。有的時(shí)候，索引庫(kù)中關(guān)于這個(gè)URL的的信息，根本沒(méi)有從這個(gè)URL抓取來(lái)的內(nèi)容，但搜索引擎知道這個(gè)URL的存在，并且有一些其它信息。
抓取和索引不是一回事。
爬行
爬行指的是搜索引擎蜘蛛從已知頁(yè)面上解析出鏈接指向的URL，然后沿著鏈接發(fā)現(xiàn)新頁(yè)面（也就是鏈接指向的URL）的過(guò)程。當(dāng)然，蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬過(guò)去抓取新頁(yè)面，而是把發(fā)現(xiàn)的URL存放到待抓地址庫(kù)中，蜘蛛按照一定順序從地址庫(kù)中提取要抓取的URL。
收錄
我個(gè)人覺(jué)得收錄和索引沒(méi)有區(qū)別。只不過(guò)收錄是從搜索用戶角度看的，搜索時(shí)能找到這個(gè)URL，就是這個(gè)URL被收錄了。從搜索引擎角度看，URL被收錄了，也就是這個(gè)URL的信息在索引庫(kù)中存在。英文并沒(méi)有收錄這個(gè)詞，和索引用的是同一個(gè)詞index。
抓取
抓取是搜索引擎蜘蛛從待抓地址庫(kù)中提取要抓的URL，訪問(wèn)這個(gè)URL，把讀取的HTML代碼存入數(shù)據(jù)庫(kù)。蜘蛛的抓取就是像瀏覽器一樣打開這個(gè)頁(yè)面，和用戶瀏覽器訪問(wèn)一樣，也會(huì)在服務(wù)器原始日志中留下記錄。

網(wǎng)站題目：昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么？
文章鏈接：http://www.muchs.cn/news25/186725.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站維護(hù)、域名注冊(cè)、企業(yè)建站、網(wǎng)頁(yè)設(shè)計(jì)公司、定制開發(fā)、網(wǎng)站建設(shè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么？

昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么？