免費英文網(wǎng)站內容重復度檢測工具(內附詳細教程)

2015-02-04    分類: 網(wǎng)站建設

最近有很多朋友找到谷歌大叔團隊,咨詢這么一個問題:剛剛放開的網(wǎng)站谷歌收錄緩慢甚至是收錄了一段時間就不收錄了,網(wǎng)站到底出了什么問題。 我們通過每一個環(huán)節(jié)的分析(具體可參考谷歌大叔之前分享的文章《完整的符合谷歌SEO營銷網(wǎng)站的檢測流程》)發(fā)現(xiàn),絕大多數(shù)的問題,都出現(xiàn)在了網(wǎng)站內容內容重復度方面。
今天谷歌大叔團隊給大家?guī)砹宋覀兘?jīng)常使用的免費內容重復度檢測工具,其中既有網(wǎng)站內容的重復度檢查工具,也有文本查重工具。希望可以幫助到遇到類似問題的朋友。
1、Siteliner
說到網(wǎng)站內容原創(chuàng)度檢測,不得不說的就是Siteliner這款利器。它的厲害之處就在于可以檢測到整個網(wǎng)站內部所有頁面的文字重復度。但前提是,需要查重的頁面沒有被robot.txt文件屏蔽。

免費英文網(wǎng)站內容重復度檢測工具(內附詳細教程)


如圖所示,直接在搜索框中輸入域名,它就會掃描網(wǎng)站的重復內容、網(wǎng)頁加載時間、每頁的字數(shù)以及內鏈和外鏈等。免費賬戶的話,Siteliner 提供網(wǎng)站250個頁面的查重。如果你的網(wǎng)站頁面超過這一數(shù)量,可能就需要付費的高級賬戶。

免費英文網(wǎng)站內容重復度檢測工具(內附詳細教程)


在概覽里面,我們可以看到整個網(wǎng)站的內容重復度狀況。如果網(wǎng)站的內容重復度(Duplicate Content)高于20%,則為垃圾網(wǎng)站。另外還要注意一下Common Content的比例,一般控制在32%左右,如果比例過高,也會影響網(wǎng)站的收錄。
如果想查看到底是哪些頁面的內容是重復的,可以查看具體的重復頁面。系統(tǒng)提供了頁面的重復字數(shù),重復度以及與之相匹配的頁面,我習慣上對重復度進行一個從上到下的排序,這樣就可以首先修改重復度比較高的頁面
。


點擊具體的URL,我們就能按到具體文字內容重復的頁面以及文字。如下圖所示,當前右半部分URL頁面中淺紅色的部分,對應的就是左邊標注淺紅色的頁面。右側淺綠色的部分,就是和左側淺綠色的頁面有重合的文字。以此類推。


當然,如圖所示的導航欄,側邊欄以及網(wǎng)站footer這些共有的部分,不可能不重復,所以我們只需要把內容部分去進行修改就可以了。
2、Copyscape
Copyscape主要是用于檢測目前的網(wǎng)絡上有沒有跟你的網(wǎng)頁重復的內容。


如圖所示,輸入域名,即可查看內容是否有重復。需要注意的一點是,Copyscape只能是單個網(wǎng)頁去進行檢索,沒有辦法一次性完成整站檢測。
顯示為New, 則表示沒有重復網(wǎng)頁。如果有重復內容,它會列出詳細的網(wǎng)址。如果是別人竊取了你的內容,你可以Email通知他們去移除內容。網(wǎng)站的重復內容大于10%,則視為垃圾網(wǎng)站。
3. Smallseotools
相信很多人都使用過這個網(wǎng)站,他的功能非常強大,其中包含關鍵詞工具,外鏈工具,內容工具等等。重點是都免費!有興趣的可以用用看。今天創(chuàng)新互聯(lián)要說的就是它的剽竊檢查工具(Plagiarism Checker)
Plagiarism Checker支持兩種檢測方式,一種是直接粘貼文本或上傳文檔檢測,字數(shù)不能超過1000字。另外一種是直接輸入網(wǎng)址。如果是你找寫手幫你寫了英文的內容,想檢查其是否為原創(chuàng),便可以使用文本檢測功能。如果是網(wǎng)站上的內容,直接使用URL檢測就可以了。


但有一點不太好的是,網(wǎng)站上面有很多的廣告,嚴重影響用戶體驗。
4. Duplichecker
Duplichecker主要是用于文本重復度檢測,免費賬戶也是有1000字符的限制。你可以直接粘貼文本進行檢測,也可以上傳文件進行檢測。無需注冊,方便快捷,但缺點也是廣告比較多,影響體驗。
5. Check-plagiarism
Check-plagiarism同樣支持文本檢測和網(wǎng)頁檢測。這個網(wǎng)站的界面就比較干凈整潔,使用起來很方便。直接輸入想要檢測的內容,點擊Check Plagiarism, 系統(tǒng)便會顯示原創(chuàng)內容(Unique Content)的比例和 重復內容(Plagiarized Content)的比例
;


除此之外,我們可以看到每一個句子的內容重復度檢測顯示,如果有重復的內容還會顯示與之相重復的網(wǎng)頁。


6、Copyleaks
Copyleaks主要提供教育和商務領域的內容原創(chuàng)度檢測功能,它是付費的,但提供30天的免費試用期。系統(tǒng)支持文件、網(wǎng)頁以及文本重復度檢測。
輸入文本或者網(wǎng)址,進行檢測,之后便會檢測出網(wǎng)絡上與之相重復的部分,并顯示網(wǎng)址以及重復程度。
copyleaks重復程度
;
打開詳細報告,便可查看具體的重復部分。
;

谷歌大叔團隊經(jīng)常會使用Siteliner 檢測整站內容的原創(chuàng)度,Copyscape 檢測網(wǎng)站同網(wǎng)絡上其他內容的重復度,其他的4款工具作為文本內容原創(chuàng)度檢測工具。通過仔細的檢測,確保網(wǎng)站內容的原創(chuàng)度。
;
當然有的時候在檢查文章內容的原創(chuàng)度的時候,我們還是會使用最古老,最簡答的方法-谷歌搜索。隨便在文章中挑出幾句話,放在搜索引擎里面,檢查是否與現(xiàn)在網(wǎng)絡上的內容有重復。

分享名稱:免費英文網(wǎng)站內容重復度檢測工具(內附詳細教程)
標題路徑:http://www.muchs.cn/news/33436.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供Google、做網(wǎng)站響應式網(wǎng)站、企業(yè)建站、網(wǎng)站設計網(wǎng)站策劃

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務器托管