2023-01-01 分類: 網(wǎng)站建設(shè)
在6月15的《谷歌中文網(wǎng)站管理員博客》中,出現(xiàn)了一篇介紹“豐富網(wǎng)頁摘要”的文章??吹竭@篇博客,我就知道3年前對(duì)google的預(yù)測(cè),現(xiàn)在終于變成現(xiàn)實(shí)了。不過沒想到在眾多網(wǎng)站還沒普及這些新技術(shù)的情況下,google這么快就開始應(yīng)用了。
關(guān)于“豐富網(wǎng)頁摘要”的詳細(xì)介紹,大家可以點(diǎn)上面的鏈接去了解。“豐富網(wǎng)頁摘要”,用一句話說明一下就是:你給你的網(wǎng)站的某些內(nèi)容,用特定的格式標(biāo)注一下,就可以讓你的網(wǎng)頁在google的搜索結(jié)果中,顯示更多的結(jié)構(gòu)化的信息。比如那個(gè)博客上的截圖:
豐富網(wǎng)頁摘要
當(dāng)用戶搜索“drooling dog”,用戶能在搜索結(jié)果頁直接看到網(wǎng)頁上的產(chǎn)品有多少人評(píng)論以及價(jià)格范圍。
這些信息是在原網(wǎng)頁中本來就有的:http://www.yelp.com/biz/drooling-dog-bar-b-q-colfax
如果你的網(wǎng)站也能這樣呈現(xiàn)搜索結(jié)果給用戶,有什么好處自然是不用說的。接下來要講的是google為什么會(huì)采用“豐富網(wǎng)頁摘要”。下面給大家呈現(xiàn)一下以前我的分析過程。這樣你也能預(yù)測(cè)搜索引擎以后會(huì)做些什么了。
我們?nèi)绻驹谒阉饕娴慕嵌热タ?,就發(fā)現(xiàn)作為一個(gè)通用搜索引擎,其實(shí)是非常不容易的。搜索引擎面對(duì)的是上百億的網(wǎng)頁,先不說分詞、索引、以及抓取和排序等等的技術(shù)。先來看搜索引擎如何判斷網(wǎng)頁上有什么內(nèi)容,就發(fā)現(xiàn)是件很復(fù)雜的事情。
互聯(lián)網(wǎng)上可以說什么樣的網(wǎng)站都有,體現(xiàn)在網(wǎng)頁的代碼里,什么樣的HTML寫法都有的。 在具體的網(wǎng)頁設(shè)計(jì)上,有些網(wǎng)站用模版做網(wǎng)站,可能僅僅只有一個(gè)區(qū)域內(nèi)的內(nèi)容是有效的;而有些不用模版,網(wǎng)頁上從頭到尾都是有價(jià)值的內(nèi)容;每個(gè)網(wǎng)站的代碼都是如此不相同而且混亂,但是搜索引擎還要通過這些HTML代碼來判斷你的重點(diǎn)內(nèi)容。搜素引擎要從這么多繁雜的網(wǎng)頁里提煉有價(jià)值的內(nèi)容給用戶,那個(gè)過程非常的痛苦。
我曾經(jīng)和前yahoo中國(guó)的工程師一起做過一些事情,發(fā)現(xiàn)這樣的互聯(lián)網(wǎng)現(xiàn)狀太考驗(yàn)一個(gè)公司的技術(shù)水平了。到如今,像google這樣的公司,在處理網(wǎng)頁噪音的時(shí)候都還遇到很多困難的。 所以,如果有一種統(tǒng)一的格式和標(biāo)準(zhǔn),讓大家來遵守,大家把網(wǎng)站里的內(nèi)容都用這個(gè)標(biāo)準(zhǔn)把信息結(jié)構(gòu)化的話,那對(duì)搜索引擎來說是一件非常幸福的事情。
現(xiàn)在博客搜索里,google已經(jīng)開始應(yīng)用一些現(xiàn)成的標(biāo)準(zhǔn)了。如:
在google的博客搜索里搜索“SEM一家之言”,出現(xiàn)這樣的搜索結(jié)果:
google博客搜索
大家看這個(gè)搜索結(jié)果,已經(jīng)把博客發(fā)布的時(shí)間和作者給列出來了的。但是可以看到,這兩個(gè)頁面的排版和頁面代碼都是不一樣的。那搜索引擎是怎么準(zhǔn)確的知道這兩個(gè)信息的呢? 特別是第二個(gè)結(jié)果,google列出的那個(gè)時(shí)間的格式和我博客上的格式是不一樣的。
原因倒非常簡(jiǎn)單。因?yàn)檫@兩個(gè)博客都提供了RSS供稿,在RSS文件里,都用一個(gè)標(biāo)準(zhǔn)的格式寫明了時(shí)間和作者這些信息的。
RRS文件
google通過讀取這個(gè)標(biāo)準(zhǔn)化的RSS文件準(zhǔn)確的抓取到了這些信息。
除了應(yīng)用RSS這個(gè)通用的標(biāo)準(zhǔn),google還試圖創(chuàng)立一個(gè)自己的標(biāo)準(zhǔn)來規(guī)范化很多信息。像google base就是其中的一個(gè)實(shí)驗(yàn)的項(xiàng)目。google base 這個(gè)項(xiàng)目以后會(huì)有專門的介紹。它試圖把很多的信息都規(guī)范化,如你賣的東西的價(jià)格和產(chǎn)地,是否提供運(yùn)輸?shù)鹊?你的房屋租售價(jià)格和位置;甚至一個(gè)學(xué)校的課程表,都可以用特定的格式標(biāo)準(zhǔn)化。
google base還在不斷的發(fā)展和完善中,在目前的應(yīng)用中,凡是google base 里的信息,都有可能在相關(guān)的搜索結(jié)果中排在靠前的位置。
比起自己去創(chuàng)立和推廣一個(gè)標(biāo)準(zhǔn)來,應(yīng)用現(xiàn)成的標(biāo)準(zhǔn)無疑是最省事的。“微格式”和 “RDFa”就是一個(gè)這樣的現(xiàn)成的標(biāo)準(zhǔn)。具體的應(yīng)用在《谷歌中文網(wǎng)站管理員博客》的那篇文章中已經(jīng)說明了。
這些標(biāo)準(zhǔn)的應(yīng)用起來效果是非常好的。
還是同一個(gè)詞語“drooling dog”, 用美國(guó)IP,在英文版的google上搜索,在第2個(gè)搜索結(jié)果中,還是出現(xiàn)那那家“Bar B Q”,而且有個(gè)地圖標(biāo)明了地址,地圖旁邊還有地址和電話。
單獨(dú)的地圖和地址電話信息
這個(gè)搜索結(jié)果不是那個(gè)“本地商家”的搜索結(jié)果。因?yàn)檫@個(gè)結(jié)果只顯示這一家店的地址,而且特別標(biāo)注了這家店的地址和電話。
這幅地圖和地址信息在那個(gè)網(wǎng)頁上本來就有的,只是這個(gè)網(wǎng)站把它們用特定的標(biāo)準(zhǔn)標(biāo)注了才有了這種效果。
我的這個(gè)分析方式,就是站在搜索引擎的角度,來考慮如何提供更好的搜索結(jié)果給用戶。這是一種很好的SEO方法。以后大家也可以從這個(gè)角度來考慮SEO。
順便說一下的是,上面那個(gè)博客搜索里的時(shí)間都比RSS文件里的時(shí)間慢一天的,這是因?yàn)間oogle服務(wù)器所在的時(shí)區(qū)比中國(guó)時(shí)間慢的緣故。當(dāng)然谷歌是不會(huì)處理這些小細(xì)節(jié)的,包括最近谷歌的首頁上找不到登陸的地方也是。
文章標(biāo)題:SEM一家之言:豐富網(wǎng)頁摘要讓網(wǎng)站與眾不同
鏈接URL:http://muchs.cn/news26/227276.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、品牌網(wǎng)站設(shè)計(jì)、外貿(mào)建站、網(wǎng)站設(shè)計(jì)、Google、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容