關(guān)于“網(wǎng)頁相似度”相關(guān)問題的周全講解

2023-08-31    分類: 網(wǎng)站建設(shè)

站長在進(jìn)行網(wǎng)站建設(shè)的時(shí)候,有時(shí)候會(huì)碰到一個(gè)問題,那就是網(wǎng)頁相似度的問題。什么是網(wǎng)頁相似度呢?所謂網(wǎng)頁相似度,簡單的說就是兩個(gè)網(wǎng)頁的相似程度。這兩個(gè)網(wǎng)頁可以是統(tǒng)一個(gè)網(wǎng)站上的網(wǎng)頁,也可以不是統(tǒng)一個(gè)網(wǎng)站上的網(wǎng)頁,也既是其他網(wǎng)站上的網(wǎng)頁。搜索引擎在收錄網(wǎng)頁的時(shí)候,通常會(huì)對(duì)兩個(gè)網(wǎng)頁進(jìn)行比較,看看兩個(gè)網(wǎng)頁是否相似。所謂相似,就是說兩個(gè)網(wǎng)頁在頁面內(nèi)容的大部分都是相同的,這時(shí)候就可以認(rèn)為兩個(gè)網(wǎng)頁是相似的。搜索引擎在比較兩個(gè)網(wǎng)頁的時(shí)候,是采用一定的算法來進(jìn)行比較,搜索引擎通常會(huì)采用兩種方法來進(jìn)行比較:一種是根據(jù)網(wǎng)頁摘要來比較,假如多個(gè)網(wǎng)頁摘要的 md5 值一樣,證實(shí)這些網(wǎng)頁具有很高的相似度。另一種是根據(jù)網(wǎng)頁出現(xiàn)的關(guān)鍵詞,按照詞頻排序,可以取N個(gè)詞頻高的,假如其 md5 值一樣,則可以認(rèn)為這些網(wǎng)頁有很高的相似度。谷歌搜索引擎給網(wǎng)頁相似度設(shè)定的比例是60%,也就是說假如兩個(gè)網(wǎng)頁的相似度超過60%,那么被比較的網(wǎng)頁不再被收錄,假如相似度接近60%,那么被比較的網(wǎng)頁可能也會(huì)被收錄,但是搜索引擎給予的權(quán)重則比較低。這就是搜索引擎對(duì)待網(wǎng)頁相似度的態(tài)度。由此可見,網(wǎng)頁相似度對(duì)我們的網(wǎng)站的影響主要在于被比較的網(wǎng)頁是否能夠被收錄,對(duì)其他方面則基本沒什么影響。

造成網(wǎng)頁相似度問題產(chǎn)生的原因主要有兩點(diǎn):①在統(tǒng)一個(gè)網(wǎng)站內(nèi)部,拿舊的網(wǎng)頁復(fù)制做新的網(wǎng)頁,造成網(wǎng)頁里面的題目、關(guān)鍵詞、描述信息、內(nèi)容等改動(dòng)的比較少,效果被搜索引擎判定為相似度高。②在不同網(wǎng)站之間,將原來已經(jīng)被收錄的網(wǎng)頁的內(nèi)容拿來,并進(jìn)行稍微改動(dòng)或者偽原創(chuàng),效果造成里面的內(nèi)容改動(dòng)較少,或者僅僅進(jìn)行段落調(diào)整,里面的內(nèi)容沒怎么變動(dòng),這與照抄差不多,被搜索引擎判定為相似度高。搜索引擎在判斷網(wǎng)頁的相似度的時(shí)候,是挺智能的,并不是我們想象的簡單的從頭到尾進(jìn)行比較一下,而是進(jìn)行智能的分析和比較,我們對(duì)此不要抱著僥幸心理,以為把別人網(wǎng)頁的內(nèi)容照抄過來,簡單的修改了一下就可以蒙混過關(guān)。

有了問題,我們就需要進(jìn)行改正,下次避免再犯同樣的錯(cuò)誤。對(duì)于網(wǎng)頁相似度的問題,我們知道了造成的原因,就可以有的放矢。解決網(wǎng)頁相似度的有用的方法是對(duì)你的網(wǎng)頁做到真正的原創(chuàng),假如你的網(wǎng)頁內(nèi)容是原創(chuàng)出來的,只要內(nèi)容質(zhì)量高,就一定不會(huì)因?yàn)榫W(wǎng)頁相似度的問題而不收錄,一般的都能被收錄的。假如作為站長的你沒有過多的時(shí)間去寫原創(chuàng)文章,或者限于水平問題寫不出來高質(zhì)量的原創(chuàng)文章,那么你也可以進(jìn)行偽原創(chuàng),但是我們建議你為了避免纏身該網(wǎng)頁相似度問題,你需要對(duì)原來的文章進(jìn)行大幅度的修改,修改的幅度起碼也要在50%以上,這樣才可能被搜索引擎收錄。另外我們建議各位站長,在做網(wǎng)頁的時(shí)候,為了節(jié)省時(shí)間,假如需要復(fù)制原來的網(wǎng)頁,那么我們也建議您對(duì)網(wǎng)頁題目、關(guān)鍵詞、描述信息以及內(nèi)容也同樣進(jìn)行大幅度的修改,否則你的網(wǎng)頁很難被收錄的。在修改的時(shí)候可以用一些不同的代碼替代掉原來的代碼,比如使用iFrame框架庖代以前的部分內(nèi)容等等。筆者從事網(wǎng)站建設(shè)領(lǐng)域做了很長時(shí)間了,遇見到的因?yàn)榫W(wǎng)頁相似度問題不被收錄的情況不在少數(shù),在谷歌站長管理平臺(tái)上也有個(gè)html文檔工具,假如兩個(gè)網(wǎng)頁的題目和描述信息差不多,站長工具會(huì)提醒你哪兩個(gè)網(wǎng)頁的相似度高了,這時(shí)候我們就可以對(duì)之進(jìn)行修改。建議站長們多多進(jìn)入搜索引擎的管理平臺(tái)里,使用里面提供的功能,有時(shí)候會(huì)對(duì)網(wǎng)站建設(shè)很有益處的。

分享標(biāo)題:關(guān)于“網(wǎng)頁相似度”相關(guān)問題的周全講解
標(biāo)題路徑:http://muchs.cn/news47/279747.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、網(wǎng)站策劃、品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站制作、建站公司、外貿(mào)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

小程序開發(fā)